首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏CDA数据分析师

    骑行在华盛顿 针对320万次共享单车骑行数据的分析

    最近Capital Bikeshare发布了他们每个季度的骑行数据。我对前四个季度的数据进行了抓取和清理,并发布在我的GitHub中。 幸运的是,Austin Wehrwein提供了代码,从而我能够对华盛顿地区的骑行数据进行分析。 由于数据不足一整年,所以我决定不按照Andrew的将数据按年区分。 在热图中我注意到了一些趋势: · 华盛顿的骑行季节比芝加哥稍长。 · 2016年3月26日(星期六)的骑行数量最多,为14,116人次。这是樱花盛开后的一天。虽然在全年中星期六的骑行总数较少,但樱花却带来了显著的骑行高峰。 接着我又创建了一个热图,显示每天不同时段的骑行数据。 华盛顿: 320万次骑行数据的热图 对于生活在华盛顿的人群来说,对这个热图的结果应该不会感到惊讶。

    1.2K100发布于 2018-02-26
  • 电动车头盔骑行者检测数据集VOC+YOLO格式2723张3类别

    数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2723 标注数量 (xml文件个数):2723 标注数量(txt文件个数):2723 标注类别数:3 标注类别名称(注意yolo格式类别顺序不和这个对应,而以labels文件夹classes.txt为准):["face" face 框数 = 1682 helmet 框数 = 2951 rider 框数 = 3799 总框数:8432 使用标注工具:labelImg 标注规则:对类别进行画矩形框 重要说明:暂无 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证 ,数据集只提供准确且合理标注 图片预览: 标注例子:

    51200编辑于 2025-07-17
  • 来自专栏BestSDK

    骑行数据:北京最热门的购物圣地,居然不是西单

    根据八大城市各大商圈周围的订单数据骑行者们来往商圈500-1000米骑行距离订单量最大,其次是1000-1500米与200-500米。 一般情况下商圈3-5公里的辐射范围,可以发现,共享单车很大程度上连接了核心商业圈、外围的次级商业圈,以及边缘商业圈或者相邻商圈,给次级商圈、边缘商圈内带来的人口流量,缓和了原本商圈人口分散不均的状态。 从平均骑行距离来看,大型成熟商圈如南京西路、南京东路的平均骑行距离分别为1456米、1500米,可见商圈太大不用怕,商圈再大,骑行者们也愿意把车骑得越远。 同样,CBNData《研究》发现, 从北京数据来看, 三里屯、望京、建外大街等热门商圈的平均骑行距离分别为1653米、1475米、1628米。 “剁手圣地”:北京看望京 上海看徐家汇 根据骑行订单数据,CBNData结合商圈在线上的讨论热度以及人均消费水平,以共享单车的视角挖掘了八大城市的剁手圣地:北京的扫货胜地望京、上海的潮流天堂徐家汇、深圳的购物集中营宝安南路以及广州历史悠久的天河城荣登各城剁手圣地的榜首

    94680发布于 2018-03-02
  • 来自专栏咸鱼学Python

    数据分析 | Numpy实战(二) - 分析各类用户平均骑行时间

    本次复习的知识点如下: 布尔型数组及数据过滤 多维数组的构造 使用numpy保存文本文件 matplotlib折线图绘制 matplotlib图表常用属性的设置方法 图表的保存 关于数据源 上次的文章发出之后发现忘了补充数据源的链接 ,之后咸鱼补充在留言区了,有需要动手实践的朋友可以自取,下面是直通车: 数据分析 | Numpy实战(一) - 分析某单车骑行时间 分析目标 观察上次的数据数据中有的数据有会员与非会员两种用户类别。 这次我们主要分析一下两种类别用户的平均骑行时间对比。 数据读取与数据清洗 根据上次的流程示意图我们主要遵循下面几个步骤: ? 图 | 源自网络 但是在实际操作中发现,本次的实战数据非常干净,完全可以把我们的数据读取和数据清洗代码结合到一起来实现代码简化的目的。 plt.title('Member vs Casual') # rotation指定下标的倾斜角度 plt.xticks(range(0, 4), ['1st', '2nd', '3rd

    67010发布于 2019-10-09
  • 来自专栏算法channel

    蒙特利尔骑行数据分析 小案例

    结合施工专题,这阶段先总结数据分析的实践相关话题,直接使用实际数据分析,解决实际问题。 今天参考github中的一个Pandas练习,来做一把蒙特利尔的自行车骑行数据分析。 bikes.csv', sep=';', encoding='latin1', parse_dates=['Date'], dayfirst=True, index_col='Date') fixed_df[:3] 2247 Name: Berri 1, Length: 310, dtype: int64 画画日期与骑自行车出行人数的折线图,此出直接使用Series自带的 plot 方法,绘制 Berri 1 地区的骑行数据折线图 实际上,我们可以直接绘制蒙特利尔所有地方的骑行数据: fixed_df.plot(figsize=(15, 10)) ? 上图观察看到,如果某天骑行人数少,所有地区的情况就都会少。 以上就是导入数据后的一个简单数据分析,如果你有兴趣,获取数据和源码,微信我备注:骑行 不必打赏 给我点个赞 就心满意足了

    56910发布于 2020-12-02
  • 来自专栏咸鱼学Python

    数据分析 | Numpy实战(一) - 分析某单车骑行时间

    实战 分析目的 看标题就知道了,分析各季度共享单车的骑行时间。 数据收集 因为这次的数据源自网络,所以先简单看下数据的结构: ? 这里骑行时间单位为ms,所以需要转化为min需要/1000/60。 单单从上面的图可以看到以炎热的夏季和凉爽的秋季为主调的二三季度的骑行时间要高于春冬为主调的一四季度,以此判断气温变化对人们使用的共享单车的影响。 But Python 3 uses unicode, and marks bytestrings with this b. numpy.loadtxt中也声明了:Note that generators should return byte strings for Python 3k.解决:使用numpy.loadtxt从文件读取字符串,最好使用这种方式np.loadtxt(filename, dtype

    71131发布于 2019-10-09
  • 来自专栏python3

    SVN-3:主从同步

    svnsync同步 主:192.168.56.20 主svn需要通过apache发布才能同步文件到备svn 在备份svn新建sadoc项目,配置与主svn相同权限 修改项目文件夹下hooks下面的pre_revprop-change file:///application/svndata/test http://192.168.56.20/svn/test/ --username lmkmike --password 123456 同步 non-interactive file:///application/svndata/test --username lmkmike --password 123456 主SVN修改后备svn会自动同步

    94210发布于 2020-01-08
  • 来自专栏云原生生态圈

    MYSQL数据同步之基于GTID事务数据同步

    MYSQL基于GTID数据同步方式 同步原理 客户端发送DDL/DML给master上,master首先对此事务生成一个唯一的gtid,假如为uuid_xxx:1,然后立即执行该事务中的操作。 "注意行3"设置了GTID_NEXT的值,表示读取到了该事务后,那么必须要执行的是稍后列出的这个事务。 "注意行6"是在所有事务执行结束时设置的,表示自动获取gtid的值。 同步实现方式 实现单slave通过gtid数据同步 本文通过Docker以及mysql5.7 镜像进行基于GTID数据复制的同步实践。 只有slave上具有了这部分基准数据,才能保证和master的数据一致性。 GTID从库数据同步 假如当前master的gtid为A3,已经purge掉的gtid为"1-->A1",备份到slave上的数据为1-A2部分。

    5.7K20发布于 2020-09-21
  • 来自专栏云计算与大数据技术

    Python3实现MySQL数据增量更新同步到MongoDB

    目录 一、MySQL工具类 二、MongoDB工具类 三、数据同步实现代码 一、MySQL工具类 # -*- encoding: utf-8 -*- import pymysql class MySQLUtil update) print(type(stat), stat) print("-------------------end--------------------------") 三、数据同步实现代码 MongoDB.MongoDBUtil import MongoDBUtil from MySQL.MySQLUtil import MySQLUtil class SyncMysqlMongo: """ mysql同步数据到 MongoDB集合中""" """ 1、从mysql查询指定表的字段信息和表数据 2、遍历表数据的同时,通过表字段构造字典并插入列表 3、 123456" mysql_ip, mysql_db = "127.0.0.1", "test" mongo_ip, mongo_db = "127.0.0.1", "xl01" ## 数据同步对象

    2.9K10编辑于 2022-01-05
  • 来自专栏Mac软件

    mac数据备份同步工具Get Backup Pro 3激活版

    Get Backup Pro Mac版是一款mac数据备份同步工具,能够让Mac用户们快速的备份磁盘文件来保护数据的安全性哦。 id=MjU2NjEmXyYyNy4xODYuMTI0LjQ%3D软件功能数据备份使用Get Backup Pro制作数据副本。创建的备份是增量备份,这意味着仅复制原始备份期间不存在的新文件。 只需设置一个自动备份计划,然后选择将文件归档到外部磁盘,网络卷或CD和DVD,然后让Get Backup Pro保持数据安全即可。 保持文件夹同步使用同步功能,将Mac上的文件和文件夹与另一台计算机或已安装的驱动器同步。使用双向同步在一个方向上同步或在两个位置上更新文件。 与备份文件一样,同步项目可以安排在每天的特定时间运行,因此Get Backup Pro可以为您完成工

    61720编辑于 2022-08-11
  • 来自专栏机器学习AI算法工程

    300万摩拜单车出行记录数据,预测骑行目的地

    本文300万摩拜单车出行记录数据获取和源码地址: 在公众号 datadw 里 回复 摩拜 即可获取。 摩拜单车在北京的单车投放量已经超过40万。 因此,为了更好地调配和管理这40万辆单车,需要准确地预测每个用户的骑行目的地。 标注数据中包含300万条出行记录数据,覆盖超过30万用户和40万摩拜单车。 数据包括骑行起始时间和地点、车辆ID、车辆类型和用户ID等信息。参赛选手需要预测骑行目的地的区块位置。 ? 以下代码是knn算法,结合了leak。这里主要有两点创新。 len(hotLoc) >= 2: resultqizhong[hotLoc[1][0]] = 1001 if len(hotLoc) >= 3: ]) else: result[start1]=2000 result['fuck2'] = 2001 result['fuck3'

    1K40发布于 2018-03-15
  • 来自专栏大数据进阶

    flinkx数据同步

    本文会描述如下几部分的数据同步 mysql2mysql mysql2hive flinkx的版本1.12-SNAPSHOT 1.拉取代码 git clone https://github.com/DTStack =com.dm -DartifactId=Dm7JdbcDriver18 -Dversion=7.6.0.197 -Dpackaging=jar -Dfile=Dm7JdbcDriver18.jar 3. useSSL=false", "table": [ "test_users3" ]

    2.4K30发布于 2021-11-22
  • 来自专栏全栈程序员必看

    数据同步工具

    公司要搞数据平台,首当其冲的是把旧库的数据导入到新库中,原本各种数据库大部分都提供了导入导出的工具,但是数据存储到各个地方,mongdb,hbase,mysql,oracle等各种各样的不同数据库,同步起来头都大了 而且本来就是专门做ETL的,是Pentaho指定的ETL组件,对于数据清洗等处理数据的环节支持更好。但是数据效率一般,而且在生产环境也很少弄台windows机器,适合小项目,数据量比较小的同步。 实时同步 实时同步最灵活的还是用kafka做中间转发,当数据发生变化时,记录变化到kafka,需要同步数据的程序订阅消息即可,需要研发编码支持。 这里说个mysql数据库的同步组件,阿里的canal和otter canal https://github.com/alibaba/canal canal是基于mysql的binlog进行数据同步的中间件 非常适合mysql库之间的同步。 而且通过retl_buff表的监控,也可以实现一些全量数据同步。 但是otter也有一些不好的地方,比如界面上的参数并不是所有的都有用,文档写的一般,不是很清晰。

    3.5K20编辑于 2022-09-13
  • 来自专栏renhailab数据分析

    学术成果 | 基于共享单车轨迹数据的城市街道可骑行性评估

    02 街道可骑行性评估的基本思路与方法 骑行行为是骑行者对街道空间使用的结果,骑行轨迹数据反映了街道环境对于骑行行为的支持程度,使用骑行轨迹数据能够更加客观地评估城市街道可骑行性。 可骑行性评估结果的16种模式 03 街道可骑行性评估实证的数据与结果 本研究使用的轨迹数据来源于知名共享单车品牌2017年11月份深圳市龙岗区内的1%的随机抽样数据。 实证中线性回归模型调整R2为0.787,表明自变量能够有效解释城市街道的骑行频次差异,这一结果能够支持可骑行性评估。 图3. 龙岗区可骑行性评估结果 04 结论 本研究主要有3个贡献:(1)从骑行行为本身出发,提出了考虑骑行需求、共享单车供给的情况下,提出采用共享单车轨迹数据评估街道骑行环境的分析框架;(2)通过骑行需求、共享单车供给和街道环境对骑行行为的线性回归模型提取可骑行性评估指标和权重 素材来源:S3-Lab 内容排版:张一帜

    77811编辑于 2024-04-10
  • 来自专栏科控自动化

    运动控制3 Gear同步应用

    2、避免机械磨损带来的精度下降,电气同步简化了传动环节,提高了精度。 3、简化了机械结构,高速运行时有效降低机械振动,并且可以通过软件算法实现振动抑制和负荷平衡等功能。 图2 凸轮同步主从值的关系 本文主要介绍齿轮同步(Gear)应用,凸轮同步(Cam)将会在下期展开介绍。 ,图3所示为同步轴工艺对象的基本操作原理: 图3 同步轴工艺对象的基本操作原理 如图3所示,在对工艺对象完成相应组态后,需要通过编写用户程序调用相关的运动控制指令实现引导轴与跟随轴的同步运行。 同步操作过程按以下阶段实现:等待同步(跟随轴等待同步运动的开始条件)、建立同步(跟随轴将与主值进行同步)、同步运动(跟随轴按照同步操作功能跟随引导轴的位置)、结束同步(超驰同步操作,主动同步操作会被跟随轴上的运动控制工作 同步运动仿真完成后,跟随轴不必再次同步同步操作保持为“同步”状态。仿真结束后,同步操作的设定值在轴上立即生效。因此,在仿真结束时,请确保跟随轴的设定值与同步操作关系中的设定值相对应。

    2.9K31编辑于 2022-03-29
  • 来自专栏Java技术详解

    数据同步数据备份

    日常使用的移动手机或者是电脑等其它电子产品都是每天在产生不同的数据数据安全性的保证需要有很多的计算机程序设计的运行程序进行有效保证。 有限局域网或者是移动互联网,公网与内网有利于数据传输。网络可以使得两个不同端点的电子设备进行互联网连接,服务于现在的信息社会。数据同步同步客户端软件的数据到服务端节点数据服务器。 计算机编程开发的过程中使用程序在客户端采集相应的需求数据,经过传输后在后端的服务器软件程序中进行处理,会持久化到数据服务器终端。互联网设备的数据服务终端机存储着海量的日常用户数据数据备份是在客户端或这是在服务器端进程的数据处理操作,一般的程序设计是不会进行远程传输。数据传输耗时耗力,涉及到安全性的机制也有很多。程序库有本地库和远程仓库。

    78200编辑于 2023-06-18
  • 来自专栏me的随笔

    rsync同步SQLite3文件API返回旧数据

    原因解释 查询SQLite数据库时,数据库中符合查询条件的数据会以页缓存(和连接相关)的形式存放到内存中,减少后续查询的磁盘I/O操作; 修改数据库文件会导致页缓存失效; rsync命令会导致文件inode 值发生改变,cp命令不会; .NET串默认开启了数据库连接池,使用rsync命令同步文件不会使页缓存失效,所以应用查询依然走页缓存,也就无法感知到数据变化,连接字符串中禁用连接池,可解决该问题。 若要挂载的文件内容发生变化后同步到容器,需设置文件权限为777,不建议这么做。 What exactly is being cached when opening/querying a SQLite database 解决docker通过volumes挂载文件不生效,修改后容器内数据同步 ,需要重启容器才能同步的问题 docker 挂载文件不同步问题记录 解密 Docker 挂载文件,宿主机修改后容器里文件没有修改

    89220编辑于 2022-10-28
  • 来自专栏Mac软件分享

    DropSync 3 for Mac(数据同步备份软件) v3.2.5激活版

    DropSync 3 for Mac是一款适用于Mac系统的数据同步备份软件。可通过SSH在本地网络上的计算机之间,甚至在mac和远程服务器之间使用可移动硬盘。 图片DropSync 3 for Mac(数据同步备份软件)dropsync 3 mac新增功能1、更简单,更强大的浏览器在层次结构中的任何级别包括或排除文件夹不再担心根路径只是丢弃一个文件夹,就是这样 专注于您的文件其他好东西,如主机名标签,集成进度条和更可靠的网络2、更好的选择使用复选框轻松配置了许多复制选项自动完成高级rsync选项新自定义包括或排除过滤器窗格备份窗格允许您配置和监视备份文件夹的大小3、 设计持久Dropsync 3完全沙盒化,这意味着它现在完全符合Mac App Store指南。 4、双向同步Dropsync 3现在具有对双向同步的基本支持,这意味着它将确保传输的两侧都存在每个文件的最近编辑版本。双向同步显示预览,就像任何其他更新一样

    60110编辑于 2022-11-23
  • 来自专栏全栈程序员必看

    redis主从同步方式(redis数据同步原理)

    主从模式可以保证redis的高可用,那么redis是怎么保证主从服务器的数据一致性的,接下来我们浅谈下redis主(master)从(slave)同步的原理。 -1),告诉master我需要同步数据了。 master接收到psync命令后会进行BGSAVE命令生成RDB文件快照。 生成完后,会将RDB文件发送给slave。 3.命令传播 slave已经同步过master了,那么如果后续master进行了写操作,比如说一个简单的set name redis,那么master执行过当前命令后,会将当前命令发送给slave执行一遍 ,达成数据一致性。 如果不一致,master会去缓冲区中判断slave的偏移量之后的数据是否存在。 如果存在就会返回+continue回复,表示slave可以执行部分同步了。

    6K30编辑于 2022-08-01
  • 来自专栏开发技术

    异构数据同步数据同步 → DataX 使用细节

    '王五', 'w123456', '1993-01-01', '王五'), (4, '麻子', 'm123456', '1994-01-01', '麻子'); 需要将表中数据同步到 MySQL 数据库 /job/mysql2Mysql.json 当我们看到如下输出,就说明同步成功了 需要说明的是 DataX 不支持表结构同步,只支持数据同步,所以同步的时候需要保证目标表已经存在 column 因为存在列类型不匹配,导致数据插不进去,例如我将 Writer 中的 username 和 birth_day 对调下位置,然后执行同步,会发现同步异常,异常信息类似如下 Date 类型转换错误 同步正常,数据却乱了 对调下 Writer 的 username 和 pw 执行同步任务,会发现同步没有出现异常,但你们看一眼目标数据源的数据 很明显脏数据了,这算同步成功还是同步失败 job 嘛 splitPk 这个配置只针对 Reader Reader 进行数据抽取时,如果指定了 splitPk,那么 DataX 会按 splitPk 配置的字段进行数据分片,启动并发任务进行数据同步

    3.7K10编辑于 2024-06-05
领券