首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏EpiHub

    R数据科学-2(tidyr)

    R数据科学-2 是用于清洗数据的工具,如dplyr一样,其中每一列都是变量,每一行都是观察值,并且每个单元格都包含一个值。 12 7 2 2 5 23 3 3 3 3 16 6 ## 1. long data df_a 2 2 Shanghai 5 3 3 Shanghai 3 4 1 Beijing 12 5 2 Beijing 23 6 3 Beijing 16 7 1 Guangdong 7 8 2 Guangdong 3 9 3 Guangdong 6 ## 2. wide 2个参数 df %>% spread(key, value) image.png 重复列变量 有时候会碰到,需要新增一列是重复该变量的多少次,如上述例子中, 上海id=1的有2个,然后重复shanghai2

    1.3K20编辑于 2022-11-03
  • 来自专栏奇点大数据

    数据科学家节选(2

    【节选自即将由电子工业出版社出版的《数据科学家养成手册》第二章】 科学之科 在中国古汉语体系中多为单字词,所以大家想想也能猜得出“科学”一词其实并非中国所发明。 的确,“科学”是个舶来的词汇。 “科学”一词由明治维新时期日本学界初用于对译英文中的“Science”,由日本启蒙思想家西周(にしあまね,1829年~1897年)进行翻译引入的(科学——かがく),欧洲语言中该词来源于拉丁文“Scientia 科学是一种泛指的领域,数据科学、计算机科学、社会科学、经济科学、语言科学、生物科学等等,这些各领域的科学各自有各自的体系和规范以及认知特性。这些都是小的,窄而深的认知领域。 科学,不管是某个领域的科学,还是泛指的科学认知体系,都有最基本的要求——那就是精确性和体系性,即便在突破性上的特点不明显也必须保证其精确性和体系性的存在和可靠。 在使用望远镜的情况下,远处的物体通常可以放大8倍到10倍,这样看20千米外的物体就像观察距离2千米的物体一样。图为在贵州省兴建的500米口径球面射电望远镜(FAST)。 ?

    77880发布于 2018-04-10
  • 来自专栏杂七杂八

    numpy科学计算包的使用2

    zip([1, 2, 3], [4, 5, 6], [7, 8, 9]) 返回结果:[(1, 4, 7), (2, 5, 8), (3, 6, 9)] ''' print('通过真值表选择元素') x_arr -2)) print(np.where(arr > 0, 2, arr)) print('where嵌套') cond_1 = np.array([True, False, True, True, (1) elif cond_2[i]: result.append(2) else: result.append(3) print(result) # np 版本代码 result = np.where(cond_1 & cond_2, 0, np.where(cond_1, 1, np.where(cond_2, 2, 3))) print(result) ) arr2 = np_random.randn(3, 2) print('r_用于按行堆叠') print(np.r_[arr1, arr2]) print('c_用于按列堆叠') print(np.c

    2.1K120发布于 2018-04-27
  • 来自专栏龙进的专栏

    计算机科学概论复习笔记(2

    基数权重展开法 基数权重展开法把可以把任意基数的数字转换成十进制 看图 注意,10是以16为基数的计数系统中的16 以2的幂为基数的计数系统 二进制数和八进制数有很特殊的关系,只需要把二进制从左往右读

    45920编辑于 2022-10-31
  • 来自专栏数据科学与人工智能

    数据科学小技巧2:数据画像分析

    第二个数据科学小技巧:数据画像分析。 我们使用pandas_profiling库可以快速地对原始数据进行画像和分析。 一 notebook代码 ?

    94610发布于 2020-03-12
  • 来自专栏Python工程师

    Python-科学计算-numpy-2-数组(中篇)

    系统:Windows 10 Python: 2.7.9/numpy: 1.9.1 这个系列是教材《Python科学计算(第2版)》的学习笔记 今天讲讲如何从原数组经过下标存取获得新数组 > 写在前面的话 想象成一个二维表格,行方向代表0轴,列方向代表1轴 假设数组a=np.arange(5*5).reshape(5,5),相当于是一个5x5的矩阵,下标从0开始 b=a[1:3,1:4] 表示行(0轴)取第2和第 3行,1:3包括1不包括3,即为1,2;因为数组下标是从0开始,实际即第2和第3行; 列(1轴)取第2,3,4列 最终输出为两者的交集 类似于切一块没有厚度的豆腐,行和列各切几刀,最终得到的交集部分就是你最终得到的 Part 3:整数数组下标存取 c=np.arange(15,100,20),arange(开始值,终止值,步长),不包括终止值 d=c[np.array([[1,2,3],[2,3,3]])],c最终结果与下标存取采用的数组形状一致 [1,2,3]中的数字表示为原数组a中的下标索引,从0开始 执行结果 ?

    64410发布于 2019-10-23
  • 来自专栏计算机与AI

    最完整的PyTorch数据科学家指南(2

    因此,Conv2d图层需要使用Cin通道将高度为H且宽度为W的图像作为输入 。现在,对于卷积网络中的第一层,的数量in_channels将为3(RGB),并且out_channels用户可以定义数量。 为了检查一个我不太了解的新层,我通常尝试查看该层的输入和输出,如下所示,在该层我首先初始化该层: conv_layer = nn.Conv2d(in_channels = 3, out_channels 2.在每次迭代中,我们使用 model(x_batch) 3.我们使用 loss_criterion 4.我们使用loss.backward()通话反向传播该损失。

    1.6K20发布于 2020-12-14
  • 来自专栏程序人生 阅读快乐

    《具体数学 计算机科学基础 第2版》

    内容简介  · · · · · · 本书介绍了计算机的数学基础,内容涉及求和、取整函数、数论、二项式系数、特殊数、母函数(发生函数)、离散概率、渐近等等,面向从事计算机科学、计算数学、计算技术诸方面工作的人员 Graham(葛立恒)著名数学家,美国加州大学圣迭戈分校计算机与信息科学专业教席(Jacobs Endowed Chair),AT&T实验室研究中心荣誉首席科学家,美国数学学会前任主席。 Knuth奖,授予那些为计算机科学基础做出杰出贡献的人。 Oren Patashnik 著名计算机科学家,BibTeX的创始人之一,是位于拉荷亚的通信研究中心的研究员。 译者简介 张明尧:1945年12月出生,安徽大学数学系毕业并获得中国科学院数学研究所博士学位。 长期从事解析数论、代数数论以及计算数论方面的研究工作,参与翻译的著作有《数论中未解决的问题(第2版)》(R. K. Guy著)、《纯数学教程(纪念版)》(G. H.

    89620发布于 2018-10-10
  • 来自专栏SeanCheney的专栏

    《数据科学家访谈录》总结·2

    与众不同之处 在斯坦福的专业是科学技术与社会学,完全是靠自学掌握了数据科学。是一个主动学习能力非常强,很有恒心的人。 “开源数据科学高手”地址(注:好资料!) Drew Conway 《Machine Learning for Hackers》共同作者 数据科学韦恩图创建者 教育经历:计算机科学与政治科学双学位,纽约大学政治学博士 职业经历:IA Ventures 数据科学必备技能 数学、统计学、计算机科学。 数据科学的前景 传统的数据领头羊公司专注还是社交数据,Uber用于解决物流问题的方法也可以推广到一切统筹问题。其它的还包括,分析基因组、健康领域。 数据科学大概可以分为两个板块:描述分析和预测分析。预测分析型数据科学家需要一些有关于机器学习的知识,而描述型的数据科学家应该需要一些统计学知识。 相较于一般的数据科学家,是什么品质让那些卓越的数据科学家得以脱颖而出? 扎实的编程基本功和系统的思维能力是最为重要的。

    47620发布于 2018-09-19
  • 来自专栏大数据文摘

    哥伦比亚大学数据科学课程笔记(2

    课程:哥伦比亚大学数据科学课程 讲师:Rachel Schutt教授 整理听课记录如下 数据科学博客 今天我们开始讨论Rachel的新博客,这实在是棒极了,人们应该去看看她对于数据科学的洞察。 她目前正在关注的话题有:为什么我建议开设这门课程,EDA(探索性数据分析),上周的数据科学概论的分析,以及将数据科学定义为一门研究学科。 平面上有如下点:(x, y) = (1, 2), (2, 4), (3, 6), (4, 8).它们之间的关系显然是y=2x。你可以直接心算出来。 (x, y) = (2, 1), (6, 7), (2.3, 6), (7.4, 8), (8, 2),(1.2, 2). 现在单靠心算没法得到x和y 之间关系了,并且点之间并没有明显的线性关系。 解答这种问题是成为数据科学家的关键,也是为什么我们需要认真学习这些东西的原因。

    58990发布于 2018-05-21
  • 来自专栏数据科学与人工智能

    简明数据科学2):简单点,概念的解释简单点

    原文:Data Science Simplified Part 2: Key Concepts of Statistical Learning 翻译:Kaiser 在系列的第一篇,我们已经接触到了一些数据科学的关键概念和过程 对于1和2,Raj 他已经很精通了,现在的下一个挑战是3往上的,这是他算的: 3x1=4(+1) 3x2=7(+1) 3x3=10(+1) 3x4=13(+1) 3x5=16(+1) Raj 的同学 Bob 也在学同样内容,他算出来的是: 3x1=5(+2) 3x2=9(+3) 3x3=18(+9) 3x4=24(+12) 3x5=30(+15) 两个孩子其实就是建立了“乘法”的模型,我们从机器学习的角度来校验一下这两个模型

    1.2K70发布于 2018-02-28
  • 来自专栏龙行天下CSIEM

    科学瞎想系列之九十一 NVH那些事(2)

    由此可见,分数槽绕组只能每隔D或2D个极绕组导体的分布才能重复循环一次,至于到底是每隔D个极还是2D个极循环一次,取决于D是偶数还是奇数,我们分别阐述如下: ① D为偶数时 那么D/2必为整数,D个极中必然存在 即相对于D•τ波长,磁势谐波次数包括1、2、3、4、5、6、7、8…次谐波。相对于整个气隙的磁势谐波极对数υ为:(2p/D)•(1、2、3、4、5、6、7、8…)对极。 如果相对于主波p对极的谐波次数υ′,则:υ′=(2/d)•(1、2、3、4、5、6、7、8…)。 如果把主波24对极作为基波,则各谐波次数及转向即为:-1/2、+1(主波)、-2、+5/2、-7/2、+4… 例2:一台2p为20极、z为24槽的三相电机,则每极每相槽数q=24/(20•3)=2/5, D=5为奇数,z与p的最大公约数为2,即整个电机可以分为t=2个单元电机,每个单元电机内有10个极(2D=10),12个槽。

    2.5K21发布于 2019-04-30
  • 来自专栏数据库与编程

    科学家一天创造:婴儿 Llama2

    这个故事是一个科学家,用一天的时间,就像一天中的一个小冒险,创造了一个叫做 "婴儿 Llama2" 的小绵羊。现在,我们将快速地体验一下他的成果,看看这个 "llama2.c" 到底是什么样子。 我们可以使用一个魔法指令,就像是在地图上划出一条路线一样: git clone https://github.com/karpathy/llama2.c.git 然后,就像是进入一个神秘的森林,我们进入这个文件夹 : cd llama2.c 接下来,就像是在准备一个魔法咒语一样,我们需要编译项目,让它变得有力量。 这些宝物会帮助 "婴儿llama2" 创造出美妙的故事。我们有三种大小的宝物可供选择:15M、42M 和 110M。你可以想象它们就像是不同大小的魔法石,它们会影响故事的流畅程度和速度。 这就是今天的小冒险,通过一个科学家的魔法创造,我们一起体验了 "llama2" 带来的奇妙世界。如果你愿意,你还可以尝试一些魔法咒语,让故事按照你的想法发展。

    32120编辑于 2023-09-01
  • 来自专栏数据科学与人工智能

    【数据科学】数据科学家与数据科学

    Jeff Wu做出题为“统计学=数据科学吗? 的演讲,建议统计改名数据的科学统计数据的科学家。 数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。 (2) 数学、统计、数据挖掘等 除了数学、统计方面的素养之外,还需要具备使用SPSS、SAS等主流统计分析软件的技能。其中,面向统计分析的开源编程语言及其运行环境“R”最近备受瞩目。 非线性回归分析、判别分析等) * 定量方法(时间轴分析、概率模型、优化) * 决策分析(多目的决策分析、决策树、影响图、敏感性分析) * 树立竞争优势的分析(通过项目和成功案例学习基本的分析理念) (2) embedded systems, the signals from which are a major component of the Internet of Things, will grow from 2%

    1.4K90发布于 2018-02-26
  • 来自专栏龙行天下CSIEM

    科学瞎想系列之七十九 永磁电机(2

    不难理解随着定转子磁场拉开的角度β变化,转矩也会相应变化,β变化一周(一对极的电角度0~2π)转矩也变化一个周期。 ? 显然男宝宝在超越转子女宝宝一圈的范围内,距离也由近及远再由远及近地变化一次,由此产生的“美”也会变化一次,如图2所示。 ? 显然,当β变化一周(2π)时,定子磁场会扫过两个转子凸极,磁阻转矩变化两次。 ? 一个通电导体在磁场中会受到力的作用,受力的方向用左手定则判定,受力的大小见式(2): F=BIL (2) 如果两个导体边组成一个线圈 p•(Ld-Lq)•Is²•sin2β (9) 式中:p为极对数。

    4.1K31发布于 2018-07-26
  • 来自专栏Python工程师

    Python-科学计算-pandas-26-列表转df-2

    系统:Windows 11 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 这个系列讲讲Python的科学计算及可视化 pandas模块 今天讲讲如何将一个列表转换为 Part 2: 代码 import pandas as pd list_1 = [[1, 2, 3, 4], [2, 3, 4, 5], [6, 3, 8, 5]] print("\n列表内容: , "列c", "列d"] df = pd.DataFrame(list_1, columns=list_column) print("\ndf内容:") print(df) 图1 代码截图 图2

    61620编辑于 2023-09-27
  • 来自专栏CDA数据分析师

    数据科学优质课程推荐#2:统计入门课程篇

    我们认为最合适数据科学家的统计和概率课程是… 数据分析基础 - Part 1:使用 R 语言进行统计 德克萨斯大学奥斯汀分校(edX) 数据分析基础 - Part 2:推论统计学 德克萨斯大学奥斯丁分校 描述性统计简介(圣何塞州立大学/ Udacity):2 门课程系列之一。课程视频很短,内容不含编程。该课程有 8 条评论,综合评分 3.38 。 数学生物统计学训练营2(约翰霍普金斯大学/ Coursera):2 门系列课程之一。着力于生命统计学。该课程有 3 条评论,综合评分 3.83 。 该课程有 2 条评论,综合评分 2。 截至2016年11月,以下课程没有评论。 使用 R 语言的统计入门(DataCamp):内容包括编程。 包括 26 小时的视频内容,有超过 4万5千 人参加。 416.1x:概率:基本概念和离散随机变量(Purdue University / edX):2 门系列课程之一。

    1.7K82发布于 2018-02-26
  • 来自专栏龙行天下CSIEM

    科学瞎想系列之三十 辐射是个神马鬼(2

    上一期讲了电离辐射的危害和我们如何应对的事,接下来再说说宝宝们更关心的电脑、电视、冰箱、电吹风、微波炉等电器辐射对我们的影响。紫外线以下频率的辐射都属于非电离辐射,它们的辐射能量极小,以至于可以忽略不计,特别是家用电器属工频范畴,频率这么低主要靠传导传递能量,本身就不会产生多大辐射。至于无线电波、可见光什么的,你每天听广播看电视、晒太阳就沐浴在无线电波和明媚的阳光下,你怎么了?不好好的吗?非电离辐射对我们的影响主要是热效应和生物效应,每天沐浴在明媚阳光下你就感到温暖,靠近老师我,也会对你辐射,使你更

    64750发布于 2018-04-18
  • 来自专栏新智元

    颠覆蛋白结构预测的AlphaFold 2,改变了科学

    ---- 新智元报道   编辑:Britta 【新智元导读】现在,由DeepMind开发的蛋白质预测工具AlphaFold 2,不仅已经被超过100万名研究人员用于自己的研究,甚至直接「改变了」科学史 从Higgins的成就中不难看出,AlphaFold 2正在迅速颠覆科学和医学。 「那一刻,我知道我们改变了科学史,」Jumper说。 生命科学领域的爆炸性增长 在CASP之后的几个月里,DeepMind行动迅速。 该团队在2020年圣诞节前后预测了人体中的所有2万种蛋白质。 Hassabis 说,决定免费发布AlphaFold 2是为了最大限度地造福人类。 与此同时,AlphaFold 2也一直在运转,在去年夏天发布了2亿份蛋白质结构预测结果。 研究的步伐正在迅速加快。

    52810编辑于 2023-03-29
  • 来自专栏数据科学与人工智能

    【数据科学】数据科学入门指南

    数据科学虽然刚刚兴起,却发展迅速。 只要有数据的地方,就需要数据科学团队来分析、挖掘数据。 因而,在各个行业都需要大量的数据科学家。 所以我并不建议从最基础的数学理论开始学习数据科学。 下面的这些建议会告诉你如何高效、快速的入门数据科学 ? 数据科学知识体系图 1. 2. 边做边学 虽然学习神经网络、图像识别或者高级自然语言处理技术会很有趣,但其实,大多数的数据科学并不涉及到这些知识。所有记住以下要点尤为重要。 数据科学是一座高山,停止学习意味着你永远无法到达顶点。 但是,养成这些良好的习惯,你会很自然的成为以为数据科学专家。 掌握正确的方法和习惯,任何人都可以掌握这门科学

    1K90发布于 2018-02-26
领券