首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • datawhale AI+数据分析 task3、4

    task3思考题(遇到这个场景,你准备如何分析?希望分析出什么结果?)回答:我希望分析出大家最希望学习的主题以及最不希望学习的主题。我会先统计每一个主题所获得的票数,再进行排序。 修改提示词让ai理解sheet1和sheet2分别是一群和二群感兴趣的主题统计,数字分别代表一种活动。 总结小浣熊在给出对表的解释和要分析的指标后可以正常分析数据特征,要避免出现对操作的模糊性描述,尽量客观指出要分析数据以及如何分析。 task4日常使用ai数据分析(根据公选课评价表格选出适合自己的公选课)提示词如下:这是一些课程的评价表格。给我推荐一些好老师和其公选课,分析指标包括对老师上课的评价。 确定好主要的三部分内容的提示词,ai可以生成较好的数据分析

    14410编辑于 2025-08-27
  • 来自专栏玉树芝兰

    如何用 Llama 3 免费本地 AI 分析数据和可视化?

    帮助你消除调用大模型 API 带来的数据安全烦恼。 模型 今天我们来探讨一个有趣的话题 —— 如何使用 Llama 3 免费地进行数据分析和可视化。 关于 700 亿参数的模型,我之前已经为你撰写了一篇文章《如何免费用 Llama 3 70B 帮你做数据分析与可视化?》,如果你感兴趣,欢迎点击链接阅读。 你已经了解到 Open Interpreter 可以结合 GPT-4, Haiku,以及 Groq 下面的 Llama 3 70B 帮助我们进行数据分析与可视化了。 问题 只不过在利用 Llama 3 8B + Open Interpreter 执行数据分析过程中,你仍然会遇到一些障碍。 祝 AI 辅助数据分析愉快!

    1.9K10编辑于 2024-04-26
  • 来自专栏python数据分析实践

    Python数据分析浅谈(3)

    在这个阶段,我们需要注意几个方面: (1)尽量选择一个自己比较擅长/感兴趣的学科领域 (2)选择该学科领域的某一个或几个具体的研究方向 (3)了解研究方向中常用的研究方法、公开/可获取的数据 自己比较擅长 但是大部分情况下,我们在搜索引擎中可能找不到需要的数据,不可否认的是,搜索结果中经常会给我们带来数据存在的一些线索,要善于运用浏览器。 (3数据打包网站或者数据采集平台获取。 日常数据分析中,我们要积累一些常见的数据清洗方法,例如剔除异常值,可以直接使用3倍标准差判别;重复值和空值可以通过Excel很方便地实现。熟悉这些操作可以大大简化工作量,节约我们的时间。 Step3:描述分析 3.1 统计分析 统计分析数据分析中最广的分析方法。统计分析就是对数据进行文字描述和指标统计。 一份完整的数据报告,至少需要包含以下几部分内容: (1)分析目的 (2)分析背景和意义 (3数据来源和方法 (4)结果与分析 (5)结论和建议 事实上数据报告就像是一篇实验报告或作文,把做实验的目的

    40110编辑于 2023-02-23
  • 来自专栏大大的小数据

    @@@全民AI写代码+数据分析AI+WPS文档表格+AirScript3步搞定2024.3.14

    1、打开WPS金山表格-效率-高级开发-AirScript脚本编辑器-新建脚本 2、点击WPS AIAI写要求,写完了,插入代码 写代码,将Sheet1中的BC列,求平均值记录在D列,求和记录在E列, 计算和并赋值给E列单元格 const sum = WorksheetFunction.Sum(chineseTextB, chineseTextC) cellE.Value2 = sum } 3

    1.3K10编辑于 2024-03-25
  • 来自专栏数据科学(冷冻工厂)

    ChIP-seq 分析数据比对(3

    生成的 BAM 文件将包含用于进一步分析的对齐序列读取。 2. 参考基因组生成 首先,我们需要以 FASTA 格式检索感兴趣的基因组的序列信息。 writeXStringSet(mainChrSeqSet, "BSgenome.Mmusculus.UCSC.mm10.mainChrs.fa") 3. Rsubread 我们可以使用 Rsubread 包将 FASTQ 格式的原始序列数据与 mm10 基因组序列的新 FASTA 文件进行比对。 ", bt2Index = file.path("BSgenome.Mmusculus.UCSC.mm10.mainChrs")) 然后我们可以使用 bowtie2() 函数对齐我们的 FASTQ 数据 生成的排序和索引 BAM 文件现在可以用于外部程序,例如 IGV,也可以用于 R 中的进一步下游分析

    67810编辑于 2023-02-27
  • 来自专栏全栈工程师修炼之路

    Python3爬虫数据清理分析

    [TOC] 0x00 快速入门 0x01 分析博客提取 描述:闲来无事写了一个自己博客的标签云,对于学习爬虫与数据清理还是挺有用的; 生成词云我们需要用到几个库: pip install numoy titlestring = "" #进行标题拼接 for title in titlelist: titlestring += title + " " #对数据进行分词

    60520发布于 2020-10-23
  • 来自专栏数据科学(冷冻工厂)

    ChIP-seq 分析数据比对(3

    生成的 BAM 文件将包含用于进一步分析的对齐序列读取。图片2. 参考基因组生成首先,我们需要以 FASTA 格式检索感兴趣的基因组的序列信息。我们可以使用 BSgenome 库来检索完整的序列信息。 writeXStringSet(mainChrSeqSet, "BSgenome.Mmusculus.UCSC.mm10.mainChrs.fa")3. Rsubread我们可以使用 Rsubread 包将 FASTQ 格式的原始序列数据与 mm10 基因组序列的新 FASTA 文件进行比对。 mainChrs.fa", bt2Index = file.path("BSgenome.Mmusculus.UCSC.mm10.mainChrs"))然后我们可以使用 bowtie2() 函数对齐我们的 FASTQ 数据 生成的排序和索引 BAM 文件现在可以用于外部程序,例如 IGV,也可以用于 R 中的进一步下游分析

    83900编辑于 2023-02-13
  • 来自专栏全栈工程师修炼之路

    Python3爬虫数据清理分析

    [TOC] 0x00 快速入门 0x01 分析博客提取 描述:闲来无事写了一个自己博客的标签云,对于学习爬虫与数据清理还是挺有用的; 生成词云我们需要用到几个库: pip install numoy matplotlib titlestring = "" #进行标题拼接 for title in titlelist: titlestring += title + " " #对数据进行分词

    42410编辑于 2022-09-28
  • 来自专栏嵌入式音视频

    AI数据分析-数据可视化模块

    NumPy(Numerical Python) 是科学计算基础库,提供大量科学计算相关功能,比如数据统计,随机数生成等。 Numpy 是 Python 语言在科学计算领域取得成功的关键之一,如果想通过 Python 语言学习数据科学、人工智能(包括深度学习、语言处理等分支),就必须学习 Numpy。 ]) print(b) print('b 数组的维度:',b.shape) 执行结果如图 ---- 【示例3】创建二维数组 a=np.array([[1,2,3],[4,5,6],[7,8,9]] ],ndmin=3) print(a) 执行结果如图 ---- 【示例5】array()函数 dtype 参数的使用 a=np.array([1,2,3,4,5,6],dtype=complex) )的随机数组:') y=np.random.random(size=(3,4)) print(y) 执行结果如图

    96320编辑于 2023-03-16
  • 来自专栏Dance with GenAI

    AI数据分析:集中度分析和离散度分析

    在deepseek中输入提示词: 你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下: 读取Excel表格:"F:\AI自媒体内容\AI行业数据分析\toolify月榜\toolify2023 2列第21行-31行; 然后按照上面的计算步骤一直计算到第15列第21行-31行; 计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的简单年均增长率,写入第16列第1行,然后计算第 2行,第3数据,一直计算到第20行; 计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的复合年均增长率,然后计算第2行,第3数据,一直计算到第20行; 注意:每一步都输出信息到屏幕 但是代码要整合在一起 计算复合年均增长率的时候,年数n是固定值:13 源代码: import pandas as pd import numpy as np # 读取Excel文件 file_path = "F:\\AI 自媒体内容\\AI行业数据分析\\toolify月榜\\toolify2023年-2024年月排行榜汇总数据.xlsx" df = pd.read_excel(file_path) # 计算第2列到第15

    35710编辑于 2024-06-24
  • 来自专栏山行AI

    PandasAI——让AI数据分析

    前言 PandasAI是一款数据分析领域的ChatGPT应用,本文对原项目进行翻译旨在进行知识科普和梳理。 这个项目的github地址为:https://github.com/gventuri/pandas-ai PandasAI Pandas AI 是一个 Python 库,它为 Pandas(一款流行的数据分析和操作工具 上述代码将返回以下内容: 6 Canada 7 Australia 1 United Kingdom 3 Germany 0 United PandasAI对象 我们主要关注一下它的run方法: 环境变量 由于需要借助LLM(大模型)的能力进行分析结果生成,这里需要设置LLM的API key。 /actions/workflows/ci.yml/badge.svg [3] : https://discord.gg/kF7FqH2FwS [4] : https://pepy.tech/project

    2.3K40编辑于 2023-06-14
  • 来自专栏Dance with GenAI

    AI数据分析:根据Excel表格数据进行时间序列分析

    ChatGPT中输入提示词: 你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下: 读取Excel表格:"F:\AI自媒体内容\AI行业数据分析\toolify月榜\toolify2023 自媒体内容\AI行业数据分析”,图片标题为:2023年Top20 AI应用近一年的发展趋势; 显示图片; 注意:每一步都输出信息到屏幕 源代码: import pandas as pd import matplotlib.pyplot 自媒体内容\AI行业数据分析\toolify月榜\toolify2023年-2024年月排行榜汇总数据.xlsx' try: df = pd.read_excel(file_path) print("Excel ', ':', (0, (5, 10)), (0, (3, 5, 1, 5))] # 定义不同的虚线样式 # 绘制每条线 try: for i in range(len(y_data)): data_line 应用近一年的发展趋势') plt.xlabel('月份') plt.ylabel('月访问量') plt.legend() # 保存图片 output_dir = r'F:\AI自媒体内容\AI行业数据分析

    58410编辑于 2024-06-24
  • 来自专栏技术翻译

    数据Python:3数据分析工具

    正如它的网站所述,Pandas是一个开源的Python数据分析库。 让我们启动IPython并对我们的示例数据进行一些操作。 单独使用Python非常适合修改数据并做好准备。现在有了Pandas,您也可以在Python中进行数据分析数据科学家通常将Python Pandas与IPython一起使用,以交互方式分析大量数据集,并从该数据中获取有意义的商业智能。查看上面的网站了解更多信息。 这是来自Apache Spark项目的大数据分析库。 PySpark为我们提供了许多用于在Python中分析数据的功能。它带有自己的shell,您可以从命令行运行它。 原文标题《Big Data Python: 3 Big Data Analytics Tools》 作者:Bill Ward 译者:February 不代表云加社区观点,更多详情请查看原文链接

    5K20发布于 2018-12-13
  • 第七章 AI数据质量-3

    7.5.3 基于扩散模型(Diffusion Model)合成数据 AI图像生成是2022年以来AIGC(Artificial Intelligence Generated Content:人工智能创作内容 输出:处理后的图片信息张量(Processed image information tensor) (3) 图片解码器(Image Decoder) 图像解码器通过前置的图片信息生成器得到的信息来生成图像 7-11 基于Stable Diffusion模型生成的测试样本 除了基于文生图外,我们还可以利用StableDiffusion的图生图(Img2Img)能力来生成相似的测试样本,代码示例如代码段7-3所示 代码段7-3:基于Stable Diffusion模型的图生图模型生成测试样本代码 import torch import requests from PIL import Image from io 下面我们将演示如何基于边缘检测和姿态检测生成相似AI样本数据。 1. 基于Canny边缘检测生成样本数据 Canny边缘检测是一种常用的边缘检测算法,它可以在图像中找到明显的边缘,并将其提取出来。

    49810编辑于 2025-04-15
  • 来自专栏数据科学(冷冻工厂)

    空间转录组: DLPFC数据分析 (3)

    引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群!

    17410编辑于 2025-11-19
  • 来自专栏数说戏聊

    Python3分析CSV数据

    2.7 从多个文件中连接数据 pandas可以直接从多个文件中连接数据。 基本过程就是将每个输入文件读取到pandas数据框中,将所有数据框追加到一个数据框列表,然后使用concat 函数将所有数据框连接成一个数据框。 如果你需要平行连接数据,那么就在concat 函数中设置axis=1。除了数据框,pandas 中还有一个数据容器,称为序列。你可以使用同样的语法去连接序列,只是要将连接的对象由数据框改为序列。 有时候,除了简单地垂直或平行连接数据,你还需要基于数据集中的关键字列的值来连接数据集。pandas 提供了类似SQL join 操作的merge 函数。 因为输出文件中的每行应该包含输入文件名,以及文件中销售额的总计和均值,所以可以将这3数据组合成一个文本框,使用concat 函数将这些数据框连接成为一个数据框,然后将这个数据框写入输出文件。

    7.9K10发布于 2018-08-02
  • 来自专栏Python数据科学

    安利 3 个 pandas 数据探索分析神器!

    EDA是数据分析必须的过程,用来查看变量统计特征,可以此为基础尝试做特征工程。东哥这次分享3个EDA神器,其实之前每一个都分享过,这次把这三个工具包汇总到一起来介绍。 1. Sweetviz的一些优势在于: 分析有关目标值的数据集的能力 两个数据集之间的比较能力 但也有一些缺点: 变量之间没有可视化,例如散点图 报告在另一个标签中打开 个人是比较喜欢Sweetviz的。 3. pandasGUI PandasGUI与前面的两个不同,PandasGUI不会生成报告,而是生成一个GUI(图形用户界面)的数据框,我们可以使用它来更详细地分析我们的Dataframe。 在不同的工作流程中,每个都有自己的优势和适用性,三个工具具体优势如下: Pandas Profiling 适用于快速生成单个变量的分析。 Sweetviz 适用于数据集之间和目标变量之间的分析。 PandasGUI适用于具有手动拖放功能的深度分析

    70320发布于 2021-10-19
  • 来自专栏Python绿色通道

    数据分析篇 | Pandas基础用法3

    3) 下列代码与上述代码等效 >>> (df.pipe(h) ... .pipe(g, arg1=1) ... .pipe(f, arg2=2, arg3=3)) pandas 鼓励使用第二种方式 要是想把数据作为第二个参数,该怎么办?本例中,pipe 为元组 (callable,data_keyword)形式。.pipe 把 DataFrame 作为元组里指定的参数。 用好 apply() 可以了解数据集的很多信息。 transform() 方法返回的结果与原始数据具有同样索引,且大小相同。这个 API 支持同时处理多种操作,不用一个一个操作,且该 API 与 .agg API 类似。 第一层是原始数据集的列名;第二层是 transform() 调用的函数名。

    2.1K20发布于 2019-12-09
  • 来自专栏生信菜鸟团

    GEO数据分析流程之芯片3

    三周合计15天的数据挖掘授课学员一点一滴整理的授课知识点笔记哦,还有互动练习题哈,欢迎大家点击文末的阅读原文去关注我们学员的公众号哦! 生信技能树学习笔记 GEO分析之PCA和热图 rm(list = ls()) load(file = "step1output.Rdata")load(file = "step2output.Rdata ")#输入数据:exp和Group#Principal Component Analysis#http://www.sthda.com/english/articles/31-principal-component-methods-in-r-practical-guide show_rownames = F, annotation_col=annotation_col, scale = "row", breaks = seq(-3,3

    20010编辑于 2024-06-28
  • 来自专栏数说戏聊

    Python3分析Excel数据

    worksheet.name, "\tRows:",\ worksheet.nrows, "\tColumns:", worksheet.ncols) 导入xlrd模块open_workbook函数读取和分析 5 Worksheet name: march_2013 Rows: 7 Columns: 5 3.2 处理单个工作表 3.2.1 读写Excel文件 使用pandas分析 pandas将所有工作表读入数据框字典,字典中的键就是工作表的名称,值就是包含工作表中数据数据框。所以,通过在字典的键和值之间迭代,可以使用工作簿中所有的数据。 当在每个数据框中筛选特定行时,结果是一个新的筛选过的数据框,所以可以创建一个列表保存这些筛选过的数据框,然后将它们连接成一个最终数据框。 在所有工作表中筛选出销售额大于$2000.00的所有行。 然后,用loc函数在每个工作表中选取特定的列,创建一个筛选过的数据框列表,并将这些数据框连接在一起,形成一个最终数据框。

    4.4K20发布于 2018-08-02
领券