首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Lauren的FPGA

    用FPGA实现排序(4)

    前面三篇文章我们介绍了排序的原理和具体实现方式,但都是要求序列本身是“”的。而实际情况是,给定序列本身是杂乱无章的,并非呈现“”的特征。这就要求我们先把无序序列转化为序列。 16点序列转化为序列需要3个Stage,其实Stage的个数等于log2(16)-1。每个Stage需要完成一些列的比较,其实就是实现升序和降序排列。 我们将序列的排序过程再次呈现出来如下图所示,与本文第一张图片进行对比,可以发现:从“无序”到“”是一个序列合并的过程,从“”到“单调”是一个序列分割的过程,体现了“分而治之(Divide and

    69910编辑于 2024-04-11
  • 来自专栏Lauren的FPGA

    用FPGA实现排序(1)

    典型的排序算法包括冒泡排序、选择排序、插入排序、归并排序、快速排序、希尔排序、计数排序、排序等。这其中,排序以其高度的并行性著称,非常适合于在FPGA上实现。 排序(Bitonic Sort)是数据独立(Data-independent)的排序算法,即比较顺序与数据无关,特别适合并行执行。在了解排序算法之前,我们先来看看什么是序列。 序列(Bitonic Sequence)的定义:序列是一个先单调递增后单调递减的序列,即存在两种单独特性,故为“”。 需要注意的是完全单调递增或者完全单调递减的序列也是序列,例如(0,1,4,5)和(7,5,3)均为序列。 序列的性质: (1)序列的子序列仍为序列。 ,…,a[i],b[i+1],…,b[n-1])是一个序列 Batcher定理: 若序列S为序列,即 令 那么S1和S2仍为序列,且S2中的任意一个元素不小于S1中的任意一个元素。

    1.1K10编辑于 2024-03-14
  • 来自专栏Lauren的FPGA

    用FPGA实现排序(3)

    基于排序算法的蝶形图,我们可以得到地址的变化规律。这里以长度为16的序列为例,其地址变化规律入下图所示。由于长度为16,故总共需要4个Stage。 仍以长度为16的序列为例,Stage 为0时,延迟级数为8,Stage 为1时,延迟级数为4,Stage为2时,延迟级数为2,Stage为3时延迟级数为1。 在此基础上,将4个SDF相连即可实现串行输入/串行输出的排序。下图给出了Stage 0对应的SDF结构。 下图显示了相应的仿真结果。

    43510编辑于 2024-04-11
  • 来自专栏机器学习算法与Python学习

    排序算法 | 排序(Bitonic sort)详解与Python实现

    本篇为排序算法系列第二篇,详细讲述排序算法。 01 什么是排序(Bitonic sort)? 从定义上了解下什么是序列(由非严格增序列X和非严格降序列Y所构成的任意组合多属于序列),定义如下: 一个序列 a1,a2, …,an 是序列,必须满足以下条件: (1)存在一个 ak(1 则得到的MAX和MIN序列仍然是序列,并且MAX序列中的任意一个元素不小于MIN序列中的任意一个元素。 其实,到现在还有两个问题: 怎么把普通序列变成双序列? 怎么对序列进行排序? 针对序列Z,根据Batcher定理,Z可以划分为2个序列X和Y,然后继续对X和Y进行递归划分,得到更短的序列,直到得到的子序列长度为1为止。这时的输出序列按单调递增顺序排列。 将两个相邻&单调性相反的单调序列看作一个序列, 每次将这两个单调序列merge生成一个新的序列, 然后进行排序,不断上述过程。

    3.3K30发布于 2021-04-30
  • 来自专栏AutoML(自动机器学习)

    排序Bitonic Sort,适合并行计算的排序算法

    1、序列 在了解排序算法之前,我们先来看看什么是序列。 序列是一个先单调递增后单调递减(或者先单调递减后单调递增)的序列。 3、排序 假设我们有一个序列,则我们根据Batcher定理,将该序列划分成2个序列,然后继续对每个序列递归划分,得到更短的序列,直到得到的子序列长度为1为止。 排序示意图1: [1wgenlx21s.png] 4、任意序列生成双序列 前面讲了一个序列如何排序,那么任意序列如何变成一个序列呢? 和前面sort的思路正相反, 是一个bottom up的过程——将两个相邻的,单调性相反的单调序列看作一个序列, 每次将这两个相邻的,单调性相反的单调序列merge生成一个新的序列, 然后排序( 同3、排序)。

    3.4K11发布于 2019-01-03
  • 来自专栏AutoML(自动机器学习)

    【转载】排序Bitonic Sort,适合并行计算的排序算法

    1、序列 在了解排序算法之前,我们先来看看什么是序列。 序列是一个先单调递增后单调递减(或者先单调递减后单调递增)的序列。 3、排序 假设我们有一个序列,则我们根据Batcher定理,将该序列划分成2个序列,然后继续对每个序列递归划分,得到更短的序列,直到得到的子序列长度为1为止。 排序示意图[1]: ? 4、任意序列生成双序列 前面讲了一个序列如何排序,那么任意序列如何变成一个序列呢? 同3、排序)。 所以一般来说,并行计算中常使用排序来对一些较小的数组进行排序[3]。 如果要考虑不用padding,用更复杂的处理方法,参考[4] n!=2^k的排序网络,本文略。

    3K30发布于 2019-01-07
  • 来自专栏全栈程序员必看

    百度之星资格赛——Disk Schedule(旅行商问题)

    Bentley 建议通过仅仅考虑旅程(bitonic tour)来简化问题,这样的旅程即为从最左点開始。严格地从左到右直至最右点,然后严格地从右到左直至出发点。 下图(b)显示了相同的7个点的最短路线。 在这样的情况下,多项式的算法是可能的。其实。存在确定的最优路线的O(n*n)时间的算法。 这个路线不是的。b)同样点的集合上的最短闭合路线。长度大约是25.58。 这是一个算导上的思考题15-1。 首先将给出的点排序,keywordx。又一次编号。从左至右1,2。3,…。n。 依据旅程。我们知道结点n一定与n相连,那么,假设我们求的dp[n][n-1],仅仅需将其加上d[n-1][n]就是最短闭合路线。 依据上图。

    41720编辑于 2022-07-10
  • 移动端代码优化实战:AndroidiOS端性能优,解决卡顿、闪退、耗电问题

    今天我们就来分享Android和iOS端的代码优化实战攻略,针对性解决卡顿、闪退、耗电三大核心问题,让你的APP体验翻倍。 三、端通用优化技巧:提升APP整体体验除了两端各自的优化技巧,还有一些通用的优化方案,适用于Android和iOS端,能够进一步提升APP的性能和用户体验:1.图片优化:统一图片格式(如Android 四、实战案例总结我们以一个电商APP为例,对比端优化前后的核心指标:优化维度Android端(优化前)Android端(优化后)iOS端(优化前)iOS端(优化后)帧率30-40fps(卡顿)稳定60fps -45fps(卡顿)稳定60fps(无卡顿)闪退率1.2%0.1%1.5%0.05%1小时耗电20%5%18%4%启动时间3.5秒1.2秒3.0秒1.0秒包体积80MB45MB75MB40MB优化后,端 掌握Android和iOS端的性能优化技巧,针对性解决卡顿、闪退、耗电三大核心问题,才能打造出体验优秀的APP,提升用户留存率和满意度。

    32810编辑于 2026-04-16
  • 路径开发:Kernel 直与自定义算子工程的场景适配与效能对比》

    一、核心概念与技术特性辨析 1.1 Kernel 直工程 定义:跳过框架高阶 API 封装,直接通过硬件原生接口(如 NPU 的 Kernel Launch、CPU 的 ICPU_RUN_KF 宏)调用计算核心的开发模式 案例参考:DRAFTS 项目先通过 Kernel 直验证去色散算子性能,再封装为自定义算子集成到完整模型管线。 五、总结 Kernel 直与自定义算子工程并非对立关系,而是互补的路径开发模式:前者聚焦 “快速验证”,以开发效率换时间,适合原型阶段;后者聚焦 “生产落地”,以工程化换稳定性与性能上限,适合部署阶段 实际开发中,建议采用 “Kernel 直验证原型 + 自定义算子工程化落地” 的组合策略,既保证迭代速度,又能满足规模化应用需求。 随着 AI 硬件架构的迭代(如 NPU 专用计算单元、异构存储),自定义算子工程的自动化优化能力(如自动 Tiling、混合精度)将成为效能提升的核心驱动力,而 Kernel 直仍将作为底层性能优的关键手段

    25510编辑于 2025-12-24
  • 9 段 IT 工程师画像 + 成长落地指南

    单元测试,保证代码可运行 做好单点技术执行,是团队基础执行单元 2 段主动校验层 接收需求后主动核对细节、反馈矛盾点,编码后自主基础联 具备模块级独立解决问题能力,成为团队可靠技术执行者 4 段经验复用层 完成模块工作后梳理规范 / 排障技巧,形成文档供团队复用,主动配合跨模块联 提升阶段(6-7 段):从项目操盘到业务赋能,打通技术与业务壁垒核心目标:从技术做事到技术为业务服务,能牵头项目、协调跨部门资源项目管理:主动申请担任中小型项目技术负责人,负责整体方案设计、任务分配、进度把控和跨团队协调 贯穿全阶段的 3 个底层习惯(成长核心)维持续学习:技术上每月学 1 个新知识点并尝试落地,业务上持续了解企业全业务链路与行业发展动态;常态化复盘沉淀:每日 / 每周 10 分钟短复盘记录问题与改进点 避坑提醒:3 个常见成长误区只钻技术不懂业务:脱离业务的技术无实际价值,难以突破 6-7 段;只做自己的事不沉淀:个人能力天花板有限,不分享沉淀无法实现从个人到团队的突破;拒绝管理与统筹:9 段工程师是技术

    26610编辑于 2026-02-06
  • 来自专栏镁客网

    【每日要闻】特斯拉车价两周内三连涨;RISC-V架构巨头SiFive再获1.75亿美元融资

    专注美国市场 3、RISC-V巨头SiFive完成1.75亿美元F轮融资 4、大众赫伯特·迪斯再次称赞特斯拉 5、LG或为iPhone 14高端机型供应LTPO面板 6、五菱全新微型电动车Air EV曝光,售价6- 这也是特斯拉两周内第三次涨价,3月10日,其中Model 3电机全轮驱动高性能版、Model Y电机全轮驱动长续航版、Model Y电机全轮驱动高性能版三款车型的售价均上调1万元。 随后在3月15日,Model 3高性能版再涨价1.8万元,Model Y电机长续航、高性能版分别上涨1.8万、2万元。 6、五菱全新微型电动车Air EV曝光,售价6-7万 近日,车圈大V@汽车拍客阿睿曝光了一组五菱全新车型Ari EV的无伪谍照。据悉,五菱Air EV内部代号为E230。 从曝光的图片来看,五菱Air EV挂的是五菱银标,同时带有快充口,那么据此推断,它的价格肯定要比MINI EV更贵,有可能落到6-7万元之间。

    55520编辑于 2022-03-21
  • 腾讯云直播能力升级:健康报告+监播报告AI解读,开启直播智能运维新时代

    01创新突破,健康报告重新定义直播流质量管控直播流分析打分系统,让问题诊断一目了然作为同类 PaaS 产品中针对直播流的 “智能体检中心”,健康报告从推流、播放、录制、截图、转码、回、拉流转推 7 大核心功能构建评估体系 02AI赋能监播报告,复杂数据秒级解读,决策效率快速提升Agent 模型驱动,让监播报告“会说话”针对传统监播报告数据量大、解读门槛高的痛点,腾讯云直播全新上线监播报告 AI 解读功能,依托云直播团队深度优的 03不止运维,功能配合解锁多场景应用价值教育直播:守护教学体验的“质量管家”在线课堂对直播稳定性要求严苛 —— 延迟超 3 秒会影响师生互动,低帧率则导致板书模糊。 实时监播功能还可以通过智能识别精准拦截线上教学、互动课程中的违规内容,保障学生尤其是未成年人的身心健康。 腾讯云直播始终致力于以技术创新驱动行业升级,本次能力上线,标志着直播运维从 “经验驱动” 正式迈入 “数据 + AI 双轮驱动” 时代。

    30510编辑于 2025-07-16
  • 来自专栏音视频咖

    腾讯云直播能力升级:健康报告+监播报告AI解读,开启直播智能运维新时代

    01、创新突破,健康报告重新定义直播流质量管控 直播流分析打分系统,让问题诊断一目了然 作为同类 PaaS 产品中针对直播流的 “智能体检中心”,健康报告从推流、播放、录制、截图、转码、回、拉流转推 赋能监播报告,复杂数据秒级解读,决策效率快速提升 Agent 模型驱动,让监播报告“会说话” 针对传统监播报告数据量大、解读门槛高的痛点,腾讯云直播全新上线监播报告 AI 解读功能,依托云直播团队深度优的 03、不止运维,功能配合解锁多场景应用价值 教育直播:守护教学体验的“质量管家” 在线课堂对直播稳定性要求严苛 —— 延迟超 3 秒会影响师生互动,低帧率则导致板书模糊。 实时监播功能还可以通过智能识别精准拦截线上教学、互动课程中的违规内容,保障学生尤其是未成年人的身心健康。 腾讯云直播始终致力于以技术创新驱动行业升级,本次能力上线,标志着直播运维从 “经验驱动” 正式迈入 “数据 + AI 双轮驱动” 时代。

    59700编辑于 2025-07-12
  • 来自专栏IT从业者张某某

    C++100-C++拓展002-float精度问题

    本文为C++拓展内容,包括float精度为6-7的问题,并提供相关案例练习。 浮点数分为单精度浮点数(32位)和精度浮点数(64位)。浮点数的基本格式如下: sign:符号位,0表示正,1表示负 exponent:阶码,浮点数的幂次。一般采用移码表示。 尾数位23位,则有2^23 = 8388608,一共七位有效数字(能保证的为6位),即float的精度为6-7位有效数字。

    59120编辑于 2023-10-16
  • 来自专栏脑机接口

    北师大卢春明课题组发表论文揭示了亲子互动通过亲子大脑同步影响儿童认知能力的机制

    该行为是指儿童全身心地服从指令,心甘情愿地接受规则,并对成人的价值观有一种内在的认同感。这种行为从3岁开始发展,在6-7岁时达到较高水平。

    90740编辑于 2023-02-13
  • 2.3 CE修改器:浮点数扫描

    本关中,健康值为单精度浮点数,弹药值为精度浮点数,需要将这两项数值都修改为 5000 或更高。提示建议禁用“快速扫描”功能,以获取更准确的扫描结果。 这里首先科普一下,单精度浮点数与精度浮点数是计算机中常用的两种浮点数数据类型,它们之间的主要区别在于所占用的内存大小和表示的数据范围。 单精度浮点数 float 是一种32位的浮点数数据类型,由一位符号位、8位阶码和23位有效数字组成,可以表示的数值范围大约为1.4E-45到3.4E38,精度为6-7位,适用于大多数的科学计算和工程领域 因为精度浮点数要占用更多的内存,所以在内存受限的场景下,单精度浮点数更为利于使用。同时,在性能要求更高的场合(例如计算机图形学和游戏开发等领域),单精度浮点数的运算速度也更快。 弹药值为精度浮点数,点击"开火"则消耗掉 0.5 的弹药。

    2.7K50编辑于 2023-11-12
  • 来自专栏全栈程序员必看

    Fork/Join框架阅读笔记[通俗易懂]

    而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被 窃取任务线程之间的竞争,通常会使用端队列,被窃取任务线程永远从端队列的头部拿 任务执行,而窃取任务的线程永远从端队列的尾部拿任务执行。 工作窃取的运行流程如图6-7所示。 图6-7 工作窃取运行流程图 工作窃取算法的优点:充分利用线程进行并行计算,减少了线程间的竞争。 工作窃取算法的缺点:在某些情况下还是存在竞争,比如端队列里只有一个任务时。并 且该算法会消耗了更多的系统资源,比如创建多个线程和多个端队列。 分割的子任务分别放在端队列里,然后几个启动线程分 别从端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里,启动一个线程 从队列里拿数据,然后合并这些数据。 任务分割出的子任务会添加到当前工作线程所维护的端队列中,进入队列的头部。当 一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任 务。

    49110编辑于 2022-09-22
  • 来自专栏携程技术

    1024,携程程序猿的一天

    携程,一直是依靠服务+技术驱动公司,或者说,技术与服务,成为了携程勇往直前的引擎,而你们,正是组成这个强大引擎的动力所在! 音乐会上,还第一次见到了集团CTO熊老板,熊老板说: 要让对技术感兴趣的同学,对技术沉迷的大咖们,在这里能够无所顾虑地,全身心投入地奋斗。 (话说,这是要涨工资的节奏么?) ? 13:30咖啡 听完音乐,吃完饭,拿着上午秒杀到的“The Geek Coffee”套装券,去楼下咖啡店兑换了一杯咖啡,据说是技术特款。 ?

    80510发布于 2019-04-22
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    Google Earth Engine ——MCD12Q2 V6土地覆盖动态产品(非正式地称为MODIS全球植被表征产品)提供全球范围内的植被表征时间估计

    MCD12Q2第6版数据产品来自于从MODIS天底双向反射分布函数(BRDF)-调整反射率(NBAR)计算的波段增强植被指数(EVI2)的时间序列。 QA 0: Best1: Good2: Fair3: PoorBits 4-5: Maturity QA 0: Best1: Good2: Fair3: PoorBits 6- QA 0: Best1: Good2: Fair3: PoorBits 4-5: Maturity QA 0: Best1: Good2: Fair3: PoorBits 6- 0: Best 1: Good 2: Fair 3: Poor Bits 4-5: Maturity QA 0: Best 1: Good 2: Fair 3: Poor Bits 6- 0: Best 1: Good 2: Fair 3: Poor Bits 4-5: Maturity QA 0: Best 1: Good 2: Fair 3: Poor Bits 6-

    76510编辑于 2024-02-02
  • 来自专栏bisal的个人杂货铺

    Java保留两位小数的方法

    System.out.println(f); // 输出0.33 另外,float是单精度类型,精度是8位有效数字,内存分配4个字节,占32位,取值范围是10的-38次方到10的38次方,有效小数位6- 对应double是精度类型,精度是17位有效数字,取值范围是10的-308次方到10的308次方,double占用8个字节的存储空间。

    8.4K40发布于 2019-01-30
领券