腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
大数
据分析
# 1.0#=GF AC CD7.8awk '{print $0 > $2 NR}' RS='//' assignment.txt
浏览 0
修改于2018-11-21
得票数 0
回答已采纳
2
回答
大数
据分析
我正试图分析大量的GitHub存档数据,并被许多限制所困扰。我想绘制每个存储库自创建以来拥有的星星数。(仅适用于目前超过1000的回购)我的另一个选择是搜索我的本地副本,但是在每个文件中搜索一个特定的字符串(存储库名)太长了。在一个SSD驱动器上花了一个
浏览 6
提问于2014-08-02
得票数 1
回答已采纳
1
回答
大数
据分析
参考文献
我正在寻找一个好的入门书或课程的
大数
据分析
。在实际应用方面,我对在R中使用
大数
据工具特别感兴趣。谢谢!
浏览 0
修改于2016-11-21
得票数 1
回答已采纳
2
回答
大数
据分析
技术选择
我被要求评估我们需要用来解决下面描述的问题的可能的技术。可能的选项包括Hadoop、Hive和Pig。我对这两个都没有太多的经验。如果你能指出一个好的阅读来源的话。我在谷歌上搜索了大量的参考文献,但很难找到一步一步的解释或比较。用户在系统中输入句子。句子按单词拆分,并存储在Cassandra列族中。每一行都是一个单词(键),列名是输入此记录时没有列值的时间戳。a_1%必须是从现在到过去的期间T1的最高单词a_2%必须是从现在到过去的期间T2的最高单词a_3%必须是从现在到过去的期间T3的最高单词 从现在到过去,a_n
浏览 2
提问于2013-03-06
得票数 0
1
回答
深层神经网络与
大数
据分析
现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和
大数
据分析
。然而,我必须选择一个作为我未来的工作领域。 深层神经网络与
大数
据分析
相比,未来还有更大的发展空间吗?
浏览 4
修改于2017-09-22
得票数 0
回答已采纳
1
回答
使用Spark的
大数
据分析
如何修复此错误?我在执行最后一个单元格时出错,我在哪里出错了?它和我的程序版本有关系吗?或者类似的东西? count = Data.map(lambda labelPoint: (labelPoint.label,1)).reduceByKey(lambda x,y: x+y) assert type(counts3) =
浏览 14
提问于2021-10-31
得票数 0
7
回答
职业转换为
大数
据分析
我对追求
大数
据分析
的职业非常感兴趣。我更感兴趣的是分析,而不是
大数
据技术(Hadoop等),尽管我并不不喜欢它。
浏览 0
修改于2015-01-10
得票数 9
回答已采纳
1
回答
亚马逊Aurora RDS的
大数
据分析
我需要执行
大数
据分析
,比如查找两个表之间的差异。到目前为止,我一直在使用文件系统上的HIVE来完成这项工作,但是现在我们已经将所有文件行插入到Aurora中。但仍然每月我需要做同样的事情,找到差异。
浏览 1
提问于2018-10-09
得票数 0
2
回答
大数
据分析
。Elasticsearch,Logstash,Kibana,MRTG
对于更关注趋势的数
据分析
,哪种方法更适合?
浏览 17
提问于2014-10-22
得票数 1
1
回答
Django中的图-
大数
据分析
为了提供更广泛和实用的观点,我正在开发一个数
据分析
系统,在这个系统中,数据将被分析,结果(以图表的形式)将显示在前面。 我的一个对javascript很在行的朋友告诉我,这可以用js来完成。
浏览 4
提问于2013-07-24
得票数 0
回答已采纳
1
回答
如何优化迭代函数进行
大数
据分析
?
我有一个优化模型的问题。我的函数在迭代过程中递增变量(Dem)的值,以达到"WHILE“中设置的条件。使用system.time (myfunction),只使用变量Area 1和C1中的一个元素,我的计算机需要2.5秒来完成这个过程。但对于Area和C的所有元素,将需要45个小时。 我的教授说它太慢了,但我认为数据量是正常的,有什么方法可以优化它吗?选项是否应该优化函数(P
浏览 0
修改于2014-11-19
得票数 0
2
回答
用于
大数
据分析
的Hadoop映射约简框架
我选择了关于的研讨会主题,作为一个初学者,我对它的了解非常少。
浏览 0
修改于2015-07-11
得票数 1
回答已采纳
3
回答
web应用程序中的
大数
据分析
我必须使用哪些服务器端工具来处理
大数
据?有哪些方法可以做到这一点?后端的并行化和web前端的聚合可视化?当我不能以同样有效的方式使用
大数
据时,高效地存储数据是无用的。
浏览 4
提问于2015-07-20
得票数 1
1
回答
在MATLAB中方便缓存以进行
大数
据分析
。
我将在MATLAB中同时运行20个函数/过程来分析一个
大数
据集。每个函数都访问这个
大数
据集的一部分。缓存是我的主要组件,我需要向您展示MATLAB可以使用缓存能力。
浏览 2
提问于2014-07-28
得票数 1
回答已采纳
1
回答
同时使用HBase进行小数据集和
大数
据分析
?
我的问题是,我是否应该选择像Mysql/Mongo这样的2个数据库来存储小数据集,而选择HBase来存储
大数
据集? 或者我的HBase可以高效地完成这两项工作?
浏览 2
提问于2016-06-20
得票数 2
1
回答
使用Redshift vs Spark、Oozie Workflow Scheduler和Redshift分析的
大数
据分析
我们希望对存储在Amazon中的数据进行
大数
据分析
(目前为to级,但将随着时间的推移而增长)。为了建立一个能够满足我们未来需求的通用系统,我们希望使用Apache进行数
据分析
。我知道可以从HDFS、HBase和S3将数据读入Spark,但是是否支持直接从Redshift读取数据?,我的问题是,我们是应该直接通过Redshift的查询执行数
据分析
,还是应该使用上面的方法并通过ApacheSpark进行分析(这里的问题是数据局部性优化可能无法实现)?在我们的机器上设置Hadoop,然后使用Oozie通过Redshift查询来调
浏览 3
修改于2015-02-16
得票数 0
回答已采纳
3
回答
类似Excel的
大数
据数
据分析
服务
有没有像Excel那样分析
大数
据集和绘制图形的web服务?我需要一些简单,高效和网络图形用户界面。
浏览 0
修改于2016-01-20
得票数 0
回答已采纳
3
回答
Python结合Numpy/Scipy与纯C++进行
大数
据分析
“ 这两个线程都让我怀疑,对于一个使用Numpy/Scipy来生产软件来分析‘
大数
据’的Python程序员来说,了解C++是否有什么真正的优势,而
大数
据的性能显然非常重要(但代码的可读性和开发速度也是必须的
浏览 1
修改于2017-05-23
得票数 12
回答已采纳
2
回答
使用h5py在Python中进行
大数
据分析
工作的经验?
到目前为止,是否有人能够在“
大数
据”设置中使用Python?编辑:购买更多的硬件/内存当然会有帮助,但从IT的角度来看,当Python (或R,或MATLAB等)需要在内存中保存数据时,我很难将Python卖给一个需要分析庞
大数
据集的组织。因此,我希望Stackoverflow能够帮助我解决如何减少使用Python作为主要
大数
据分析
语言的风险。
浏览 3
修改于2011-03-22
得票数 46
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券