pd.unique 第5页
- 完整数据分析流程Python中的Pandas如何解决业务问题
-
#开篇作为万金油式的胶水语言,Python几乎无所不能,在数据科学领域的作用更是不可取代。数据分析硬实力中,Python是一个非常值得投入学习的工具。这其中,数据分析师用得最多的模块非Pandas莫属,如果你已经在接触它了,不妨一起来通过完整的数据分析流程,探索Pandas是如何解决业务问题的。...
- 如何用深度学习推荐电影教你做自己的推荐系统!
-
简介几乎所有人都喜欢与家人、朋友一起观看电影度过闲暇时光。大家可能都有过这样的体验:本想在接下来的两个小时里看一个电影,却坐在沙发上坐了20分钟不知道看什么,选择困难症又犯了,结果好心情也变得沮丧。所以,我们很需要一个电脑代理,在做挑选电影的时候提供推荐。现在,电影智能推荐系统已经成为日常生活中的一...
- 如何利用以往的营销数据来预测未来营销的结果
-
全文共12174字,预计学习时长25分钟甚至更长...
- 如何使用Python对数据去重学好这几种,再也不怕重复数据了!
-
在很多场景下,我们会需要一些去重的数据。比如我们有一组数据,每一条数据代表着某个用户对某条内容的阅读。假如我们需要的不是人次数据(PV:pageview),而是有多少人产生了阅读(UV:uniquevisitor),那我们就需要对数据做一个去重。在Python中,有很多工具可以提供去重的功能。在...
- 如何使用 Python 绘制 COVID-19 的全球扩散图
-
使用这些开源框架创建一个彩色地图,显示病毒的可能的传播路径。...
- 基因 ID 和 Symbol 转换
-
前言做生信分析,总是免不了要给基因ID和Symbol转换来转换去。方法...
- 基于同步行为的反欺诈算法SynchroTrap实现细节
-
作者:小伍哥...
- 在工业大数据使用分布式和并行方式进行特征提取。
-
特征提取控制通过消除系统中的冗余特征和噪声来选择重要且有用的特征,以产生最佳预测输出。动机-为什么需要提取特征?...
- 十个编码过程中的“坑”,一篇文章帮你填平了
-
全文共1730字,预计学习时长4分钟或更长数据科学家是“比任何软件工程师都更擅长统计学、又比任何统计学家都更擅长软件工程”的人。许多数据科学家都有统计学背景,但在软件工程方面经验很少。本文列出了常见的10个编码错误,希望你能认真阅读并避免它们。...