首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Lauren的FPGA

    用FPGA实现排序(4)

    前面三篇文章我们介绍了排序的原理和具体实现方式,但都是要求序列本身是“”的。而实际情况是,给定序列本身是杂乱无章的,并非呈现“”的特征。这就要求我们先把无序序列转化为序列。 16点序列转化为序列需要3个Stage,其实Stage的个数等于log2(16)-1。每个Stage需要完成一些列的比较,其实就是实现升序和降序排列。 我们将序列的排序过程再次呈现出来如下图所示,与本文第一张图片进行对比,可以发现:从“无序”到“”是一个序列合并的过程,从“”到“单调”是一个序列分割的过程,体现了“分而治之(Divide and

    69910编辑于 2024-04-11
  • 来自专栏Lauren的FPGA

    用FPGA实现排序(1)

    典型的排序算法包括冒泡排序、选择排序、插入排序、归并排序、快速排序、希尔排序、计数排序、排序等。这其中,排序以其高度的并行性著称,非常适合于在FPGA上实现。 排序(Bitonic Sort)是数据独立(Data-independent)的排序算法,即比较顺序与数据无关,特别适合并行执行。在了解排序算法之前,我们先来看看什么是序列。 序列(Bitonic Sequence)的定义:序列是一个先单调递增后单调递减的序列,即存在两种单独特性,故为“”。 需要注意的是完全单调递增或者完全单调递减的序列也是序列,例如(0,1,4,5)和(7,5,3)均为序列。 序列的性质: (1)序列的子序列仍为序列。 ,…,a[i],b[i+1],…,b[n-1])是一个序列 Batcher定理: 若序列S为序列,即 令 那么S1和S2仍为序列,且S2中的任意一个元素不小于S1中的任意一个元素。

    1.1K10编辑于 2024-03-14
  • 来自专栏Lauren的FPGA

    用FPGA实现排序(3)

    基于排序算法的蝶形图,我们可以得到地址的变化规律。这里以长度为16的序列为例,其地址变化规律入下图所示。由于长度为16,故总共需要4个Stage。 仍以长度为16的序列为例,Stage 为0时,延迟级数为8,Stage 为1时,延迟级数为4,Stage为2时,延迟级数为2,Stage为3时延迟级数为1。 在此基础上,将4个SDF相连即可实现串行输入/串行输出的排序。下图给出了Stage 0对应的SDF结构。 下图显示了相应的仿真结果。

    43510编辑于 2024-04-11
  • 来自专栏机器学习算法与Python学习

    排序算法 | 排序(Bitonic sort)详解与Python实现

    本篇为排序算法系列第二篇,详细讲述排序算法。 01 什么是排序(Bitonic sort)? 从定义上了解下什么是序列(由非严格增序列X和非严格降序列Y所构成的任意组合多属于序列),定义如下: 一个序列 a1,a2, …,an 是序列,必须满足以下条件: (1)存在一个 ak(1 则得到的MAX和MIN序列仍然是序列,并且MAX序列中的任意一个元素不小于MIN序列中的任意一个元素。 其实,到现在还有两个问题: 怎么把普通序列变成双序列? 怎么对序列进行排序? 针对序列Z,根据Batcher定理,Z可以划分为2个序列X和Y,然后继续对X和Y进行递归划分,得到更短的序列,直到得到的子序列长度为1为止。这时的输出序列按单调递增顺序排列。 将两个相邻&单调性相反的单调序列看作一个序列, 每次将这两个单调序列merge生成一个新的序列, 然后进行排序,不断上述过程。

    3.3K30发布于 2021-04-30
  • 来自专栏AutoML(自动机器学习)

    排序Bitonic Sort,适合并行计算的排序算法

    1、序列 在了解排序算法之前,我们先来看看什么是序列。 序列是一个先单调递增后单调递减(或者先单调递减后单调递增)的序列。 3、排序 假设我们有一个序列,则我们根据Batcher定理,将该序列划分成2个序列,然后继续对每个序列递归划分,得到更短的序列,直到得到的子序列长度为1为止。 排序示意图1: [1wgenlx21s.png] 4、任意序列生成双序列 前面讲了一个序列如何排序,那么任意序列如何变成一个序列呢? 和前面sort的思路正相反, 是一个bottom up的过程——将两个相邻的,单调性相反的单调序列看作一个序列, 每次将这两个相邻的,单调性相反的单调序列merge生成一个新的序列, 然后排序( 同3、排序)。

    3.4K11发布于 2019-01-03
  • 来自专栏AutoML(自动机器学习)

    【转载】排序Bitonic Sort,适合并行计算的排序算法

    1、序列 在了解排序算法之前,我们先来看看什么是序列。 序列是一个先单调递增后单调递减(或者先单调递减后单调递增)的序列。 3、排序 假设我们有一个序列,则我们根据Batcher定理,将该序列划分成2个序列,然后继续对每个序列递归划分,得到更短的序列,直到得到的子序列长度为1为止。 排序示意图[1]: ? 4、任意序列生成双序列 前面讲了一个序列如何排序,那么任意序列如何变成一个序列呢? 同3、排序)。 所以一般来说,并行计算中常使用排序来对一些较小的数组进行排序[3]。 如果要考虑不用padding,用更复杂的处理方法,参考[4] n!=2^k的排序网络,本文略。

    3K30发布于 2019-01-07
  • 来自专栏全栈程序员必看

    百度之星资格赛——Disk Schedule(旅行商问题)

    Bentley 建议通过仅仅考虑旅程(bitonic tour)来简化问题,这样的旅程即为从最左点開始。严格地从左到右直至最右点,然后严格地从右到左直至出发点。 下图(b)显示了相同的7个点的最短路线。 在这样的情况下,多项式的算法是可能的。其实。存在确定的最优路线的O(n*n)时间的算法。 这个路线不是的。b)同样点的集合上的最短闭合路线。长度大约是25.58。 这是一个算导上的思考题15-1。 首先将给出的点排序,keywordx。又一次编号。从左至右1,2。3,…。n。 依据旅程。我们知道结点n一定与n相连,那么,假设我们求的dp[n][n-1],仅仅需将其加上d[n-1][n]就是最短闭合路线。 依据上图。

    41720编辑于 2022-07-10
  • 移动端代码优化实战:AndroidiOS端性能优,解决卡顿、闪退、耗电问题

    今天我们就来分享Android和iOS端的代码优化实战攻略,针对性解决卡顿、闪退、耗电三大核心问题,让你的APP体验翻倍。 三、端通用优化技巧:提升APP整体体验除了两端各自的优化技巧,还有一些通用的优化方案,适用于Android和iOS端,能够进一步提升APP的性能和用户体验:1.图片优化:统一图片格式(如Android 四、实战案例总结我们以一个电商APP为例,对比端优化前后的核心指标:优化维度Android端(优化前)Android端(优化后)iOS端(优化前)iOS端(优化后)帧率30-40fps(卡顿)稳定60fps -45fps(卡顿)稳定60fps(无卡顿)闪退率1.2%0.1%1.5%0.05%1小时耗电20%5%18%4%启动时间3.5秒1.2秒3.0秒1.0秒包体积80MB45MB75MB40MB优化后,端 掌握Android和iOS端的性能优化技巧,针对性解决卡顿、闪退、耗电三大核心问题,才能打造出体验优秀的APP,提升用户留存率和满意度。

    32810编辑于 2026-04-16
  • 路径开发:Kernel 直与自定义算子工程的场景适配与效能对比》

    一、核心概念与技术特性辨析 1.1 Kernel 直工程 定义:跳过框架高阶 API 封装,直接通过硬件原生接口(如 NPU 的 Kernel Launch、CPU 的 ICPU_RUN_KF 宏)调用计算核心的开发模式 案例参考:DRAFTS 项目先通过 Kernel 直验证去色散算子性能,再封装为自定义算子集成到完整模型管线。 五、总结 Kernel 直与自定义算子工程并非对立关系,而是互补的路径开发模式:前者聚焦 “快速验证”,以开发效率换时间,适合原型阶段;后者聚焦 “生产落地”,以工程化换稳定性与性能上限,适合部署阶段 实际开发中,建议采用 “Kernel 直验证原型 + 自定义算子工程化落地” 的组合策略,既保证迭代速度,又能满足规模化应用需求。 随着 AI 硬件架构的迭代(如 NPU 专用计算单元、异构存储),自定义算子工程的自动化优化能力(如自动 Tiling、混合精度)将成为效能提升的核心驱动力,而 Kernel 直仍将作为底层性能优的关键手段

    25510编辑于 2025-12-24
  • 来自专栏全栈程序员必看

    OpenGL中的投影使用

    这是一个经典的嵌套变换的样例,我们使用矩阵堆栈将一个物体依据还有一个物体进行变换,执行结果如图所看到的: /* 程序清单 4-3 * 2014/5/18 */ #include <glut.h 设置画图颜色为绿色 glColor3f(0.0f, 1.0f, 0.0f); // 打开深度測试 glEnable(GL_DEPTH_TEST); } // 绘制场景(显示回函数 int argc,char *argv[]) { // 传递命令行參数,并对GLUT函数库进行初始化 glutInit(&argc, argv); // 设置创建窗体时的显示模式(缓冲区 设置窗体的初始大小 glutInitWindowSize(480, 320); // 创建窗体 glutCreateWindow(“Bounce”); // 设置显示回函数 glutDisplayFunc(RenderScene); // 设置当窗体的大小发生变化时的回函数 glutReshapeFunc(ChangeSize);

    1.4K10编辑于 2022-07-12
  • 来自专栏CSDN旧文

    Idea 自动生成方法注释(含参数及返回值)各版本通用。

    Data$ * @ParamType:$Type$ * @ParamName:$Name$ * @Return:$Return$ * @Description: */ 所有文字都是常量,只有dollar 步骤4-3 编辑变量 按我的编辑即可。 步骤4-4 更改适用类型 步骤5 执行 输入 /* 按Tab即可。

    2K30编辑于 2022-04-13
  • 来自专栏IT技术圈(CSDN)

    浙大版《C语言程序设计(第3版)》题目集 练习4-3 求给定精度的简单交错序列部分和

    练习4-3 求给定精度的简单交错序列部分和 本题要求编写程序,计算序列部分和 1 - 1/4 + 1/7 - 1/10 + … 直到最后一项的绝对值不大于给定精度eps。 题目保证计算结果不超过精度范围。

    2.2K10发布于 2020-09-15
  • 来自专栏IT技术圈(CSDN)

    浙大版《C语言程序设计(第3版)》题目集 习题4-3 求分数序列前N项和

    习题4-3 求分数序列前N项和 本题要求编写程序,计算序列 2/1+3/2+5/3+8/5+… 的前N项之和。注意该序列从第2项起,每一项的分子是前一项分子与分母的和,分母是前一项的分子。 题目保证计算结果不超过精度范围。

    1.4K30发布于 2020-09-15
  • 腾讯云直播能力升级:健康报告+监播报告AI解读,开启直播智能运维新时代

    01创新突破,健康报告重新定义直播流质量管控直播流分析打分系统,让问题诊断一目了然作为同类 PaaS 产品中针对直播流的 “智能体检中心”,健康报告从推流、播放、录制、截图、转码、回、拉流转推 7 大核心功能构建评估体系 02AI赋能监播报告,复杂数据秒级解读,决策效率快速提升Agent 模型驱动,让监播报告“会说话”针对传统监播报告数据量大、解读门槛高的痛点,腾讯云直播全新上线监播报告 AI 解读功能,依托云直播团队深度优的 03不止运维,功能配合解锁多场景应用价值教育直播:守护教学体验的“质量管家”在线课堂对直播稳定性要求严苛 —— 延迟超 3 秒会影响师生互动,低帧率则导致板书模糊。 实时监播功能还可以通过智能识别精准拦截线上教学、互动课程中的违规内容,保障学生尤其是未成年人的身心健康。 腾讯云直播始终致力于以技术创新驱动行业升级,本次能力上线,标志着直播运维从 “经验驱动” 正式迈入 “数据 + AI 双轮驱动” 时代。

    30510编辑于 2025-07-16
  • 来自专栏音视频咖

    腾讯云直播能力升级:健康报告+监播报告AI解读,开启直播智能运维新时代

    01、创新突破,健康报告重新定义直播流质量管控 直播流分析打分系统,让问题诊断一目了然 作为同类 PaaS 产品中针对直播流的 “智能体检中心”,健康报告从推流、播放、录制、截图、转码、回、拉流转推 赋能监播报告,复杂数据秒级解读,决策效率快速提升 Agent 模型驱动,让监播报告“会说话” 针对传统监播报告数据量大、解读门槛高的痛点,腾讯云直播全新上线监播报告 AI 解读功能,依托云直播团队深度优的 03、不止运维,功能配合解锁多场景应用价值 教育直播:守护教学体验的“质量管家” 在线课堂对直播稳定性要求严苛 —— 延迟超 3 秒会影响师生互动,低帧率则导致板书模糊。 实时监播功能还可以通过智能识别精准拦截线上教学、互动课程中的违规内容,保障学生尤其是未成年人的身心健康。 腾讯云直播始终致力于以技术创新驱动行业升级,本次能力上线,标志着直播运维从 “经验驱动” 正式迈入 “数据 + AI 双轮驱动” 时代。

    59700编辑于 2025-07-12
  • 来自专栏强化学习专栏

    直流电机恒转速闭环调节控制系统(项目实战)

    通过调试,实现了串口通信设置目标转速、手动设置目标转速、电机自动调速、电机手动调速、电机正反转以及停止电机的功能,在目标直流电机实际转速达到目标转速时,性能指标良好;当设定目标转速为,系统的超量为8% 定时器T0中断子程序流程图如图4-3所示。 图4-3 定时器T0中断子程序流程图 5.系统调试结果与讨论 图5-1 Proteus仿真系统运行图 本次设计的直流电机恒转速闭环调节控制系统,是以单片机AT89C51为核心的PWM直流电机恒转速闭环调节控制系统 使用了Proteus进行仿真,如图5-1所示,目标转速为225r/min,实际测得转速为225±2r/min,实际电机转速为225±2r/min;系统的超量为8%,稳态误差为0.88% ,采用10%误差带的调节时间为

    1K10编辑于 2024-12-03
  • 来自专栏科技记者

    机器学习与R语言实战笔记(第三章)

    Kolmogorov-Smirnov test data: x D = 0.09625, p-value = 0.707 alternative hypothesis: two-sided # 样本 否则,包含两个或以上类别变量,要因素方差分析。 mpg ~ as.factor(mtcars$gear)) $`as.factor(mtcars$gear)` diff lwr upr p adj 4- 3.13因素方差分析 # 同样先可视化 par(mfrow=c(1,2)) boxplot(mtcars$mpg~mtcars$gear, subset = (mtcars$am==0), xlab mtcars$gear) * factor(mtcars$am)) $`factor(mtcars$gear)` diff lwr upr p adj 4-

    1.5K20编辑于 2021-12-18
  • 来自专栏前端魔法指南

    我不知道的前端(一)

    分析一下 |1-3|-|-1-3|=2-4=-2 ==> [1,-1] |3-3|-|1-3|=0-2=-2==>[3,1,-1] |4-3|-|3-3|=1>0==>[3,4,1,-1] |6-3|- |4-3|=3-1>0==>[3,4,6,1,-1] |10-3|-|6-3|=7-3=4>0==>[3,4,6,10,1,-1] 所以结果应为[3,4,6,10,1,-1] 另外注意,sort是排序原本的数组 ---- Promise的done与扩展always(或者说finally) done Promise 对象的回链,不管以then方法或catch方法结尾,要是最后一个方法抛出错误,都有可能无法捕捉到 因此,我们可以提供一个done方法,总是处于回链的尾端,保证抛出任何可能出现的错误。

    1K10编辑于 2022-08-01
  • 来自专栏携程技术

    1024,携程程序猿的一天

    携程,一直是依靠服务+技术驱动公司,或者说,技术与服务,成为了携程勇往直前的引擎,而你们,正是组成这个强大引擎的动力所在! 音乐会上,还第一次见到了集团CTO熊老板,熊老板说: 要让对技术感兴趣的同学,对技术沉迷的大咖们,在这里能够无所顾虑地,全身心投入地奋斗。 (话说,这是要涨工资的节奏么?) ? 13:30咖啡 听完音乐,吃完饭,拿着上午秒杀到的“The Geek Coffee”套装券,去楼下咖啡店兑换了一杯咖啡,据说是技术特款。 ?

    80510发布于 2019-04-22
  • 来自专栏CBeann的博客

    手写红黑树笔记

    以爸爸节点进行一次左旋,得到LL红的情景(4.2.1),然后指定爸爸节点为当前节点进行下一轮处理。 情景4-3:叔叔节点不存在,或者为黑色。 以爸爸节点进行一次右旋,得到RR红的情景(4.3.1),然后指定爸爸节点为当前节点进行下一轮处理。 以爸爸节点进行一次左旋,得到LL红的情景(4.2.1),然后指定爸爸节点为当前节点进行下一轮处理 * 情景4-3:叔叔节点不存在,或者为黑色。 并且为红色(父-叔 红)。将爸爸和叔叔染色为黑色,将爷爷染色为红色,并且在以爷爷节点为当前节点,进行下一轮处理 if (null ! parent); insertFixUp(parent); return; } } } // 情景4-

    26910编辑于 2023-12-25
领券