首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏硅光技术分享

    光子硬件加速器

    光子硬件加速器(photonic accelerator,简称PAXEL)是用光子处理一些特殊的计算任务,辅助已有的数字计算机。其典型的框架图如下图所示, ? (图片来自文献1) 与电子硬件加速器相比,光子加速器方案中信号加载在光信号上,因而会需要额外的光电转换步骤。PAXEL的主要优势是计算速度快、功耗小。 文献1中列出了光子硬件加速器的几个应用情景, 1)人工神经网络(articifical neural network) 深度学习的计算涉及大量的矩阵计算, ? 2)储备池计算(reservior computing) 储备池计算是递归神经网络的一种,其结构如下图所示,包括input层,reservior层和output层。 (图片来自文献2) 目前主要有两种典型的架构实现光学储备池计算: a)基于延迟的储备池 典型的架构如下图所示,由一个非线性器件(例如激光器)和反馈延迟线构成储备池,不同时刻的光信号构成储备池中虚拟的节点

    3.4K30发布于 2020-08-13
  • 来自专栏FPGA技术江湖

    数据中心中的FPGA硬件加速器

    再来看一篇FPGA的综述,我们都知道微软包括国内的云厂商其实都在数据中心的服务器中部署了FPGA,所以这篇论文就以数据中心的视角,来看下FPGA这个硬件加速器。 还是一样,想要论文原文的可以私信我。 Xilinx 开发了专用的自适应加速器硬件模块 ALVEO,用于数据中心相关应用。 案例研究:用于数据处理的可重构设备 硬件加速器 谷歌、微软和亚马逊已经更新了部署 FPGA 的数据中心,以增强后端的机器学习。FPGA 为节能可编程硬件架构提供了一种很有前景的替代方案。 基于全方位、基于加速器的异构集成数据中心的 VINEYARD . 如图 2 所示,它为具有粗粒度和细粒度可编程加速器的低能耗数据中心提供了一个单一平台。 最近,CESNET(捷克 NREN)演示了基于 Virtex Ultra Scale+ FPGA 的 NFB-200G2QL 加速器可在单个 NIC 卡中实现 200 Gbps 吞吐量的网络数据传输。

    75610编辑于 2025-01-11
  • 来自专栏数字芯片

    硬件工程师笔试题【2

    2、选择电阻时要考虑什么? 主要考虑电阻的封装、功率、精度、阻值和耐压值等。 3、在CMOS电路中,要有一个单管作为开关管精确传递模拟低电平,这个单管你会用P管还是N管,为什么 答:用 N 管。 集成电路前端设计流程可以分为以下几个步骤:(1)设计说明书;(2)行为级 描述及仿真;(3)RTL 级描述及仿真;(4)前端功能仿真。 硬件语言输入工具有 SUMMIT,VISUALHDL,MENTOR 和RENIOR 等;图形输入工具有: Composer(cadence),Viewlogic (viewdraw)等; 数字电路仿真工具有 假设投入 3 个 2 分硬币或者投入 4 个 1 分硬币和 1 个 2 分硬币后,卖报机在给出报纸的同时会找会 1 个 1 分硬币。这是 输出变量有两个,分别用 Y 和 Z 表示。 同时假定未投币时卖报机的初始状态为 S0, 从开始到当前时刻共投入的硬币面值为 1 分记为 S1,为 2 分时记为 S2,为 3 分 记为 S3,为 4 分时记为 S4。

    2.5K31发布于 2020-07-20
  • 来自专栏TopSemic嵌入式

    MicroPython 玩转硬件系列2:点灯实验

    2.环境介绍 2.1.硬件 ESP32 小板: ? Micro USB线: ? LED 灯: ? 2.2.软件 1) PC端Windows系统,PuTTY串口工具 2) 板子MicroPython 环境 3.控制亮灭 上面那个红色的LED灯,只要给它加一个高电平3.3V,它就可以亮,不给电压它就灭。 第2步:输入以下三条语句,就可以完成GPIO4引脚设置为高电平的功能,对应LED会点亮。 1) from machine import Pin 这句话的含义是从machine模块中导入Pin类 2) import time 这句话的含义是导入time 模块 3) led=Pin(4,Pin.OUT

    1.5K50发布于 2021-05-31
  • 来自专栏AI研习社

    谷歌全面开源 MLIR 及生态联盟,全球 95% 的加速器硬件都在使用

    TensorFlow 生态系统包含许多编译器和优化器,可在多个级别的软硬件堆栈上运行。 图 2 谷歌 MLIR(相关 ppt 见文末) MLIR 深受 LLVM 的影响,并不折不扣地重用其许多优秀理念,比如拥有灵活的类型系统,可在同一编译单元中表示、分析和转换结合多层抽象的图等。 MLIR 没有众所周知的固定或内置的操作列表(无「内联函数」),方言可完全定义自定义类型,即 MLIR 如何对 LLVM IR 类型系统(拥有一流汇总)、域抽象(对量化类型等经机器学习 (ML) 优化的加速器有着重要意义 它提供了新的基础设施和设计理念,使得机器学习模型能够在任何类型的硬件上一致地表示和执行。 ,Mediatek,NVIDIA,Qualcomm Technologies,Inc,SambaNova Systems,Samsung,Xilinx 的小米——占全球数据中心加速器硬件的 95%以上,

    2K20发布于 2019-09-17
  • 来自专栏贾维斯Echo的博客

    计算机硬件组成(2

    服务器的分类 尺寸:1u=4.45cm 外形:机架 刀片:集群 塔式 小型机:高端定制 ps:云主机(虚拟机) 阿里云、腾讯云、青云、ucloud 今日内容 一 计算机的硬件组成 计算机(电脑)==== 》模仿人 大前提:计算机的所有组成都是模仿人的某一器官或者功能去设计的 五大组成部分: 控制器:是计算机的指挥系统,负责控制所有其他硬件的运行————-》大脑     (控制器通过地址访问存储器,从存储器中取出指令 外存:比如磁盘——————————————》本子 基于磁存取数据,断电数据仍然存在 用于永久保存数据,存取速度都慢 输入设备:键盘、鼠标 输出设备:显示器、打印机 总结1: 人——-程序———》计算机硬件 人——-程序———》cpu——》计算机其他硬件 总结2: 程序的运行与计算机三大核心硬件:cpu、内存、硬件的关系: 程序首先是存放于硬盘中的 程序的运行需要先经历加载的过程——》程序的代码/数据从硬盘读入内存 x86-64(*****) 摩尔定律:CPU有多条线程 cpu:2核4线程(****) 2核-》2个cpu核心 每个核内部有两条流水线=》2核有4条流水线 三 存储器详解 寄存器-》L1 高速缓存

    62810编辑于 2023-10-18
  • 来自专栏机器人课程与技术

    ROS 2 感知节点的硬件加速

    本文讨论了硬件加速如何使机器人速度更快,以及选择正确的加速器有多重要。基准测试结果表明 ROS 节点的加速解决方案之间的加速差异超过 500 倍。 移动得更快(或更灵巧)需要在边缘进行更快的感知计算。 但是退后一步Graphs看看Nodes有助于解决以下问题: 对于我们的每一个 ROS 2 节点,哪个加速器(GPU、FPGA 等)是最好的? 这需要额外的理解和基准测试。 机器人中最流行的加速器是 FPGA 和 GPU: FPGAs:FPGAs 是软件和硬件可编程的,并提供完全的灵活性和能力来构建混合不同硬处理器和软处理器的混合控制和数据驱动的计算模型。 关于感知模块在 ROS 2 节点中对硬件加速进行基准测试 为了比较 ROS 2Nodes在 FPGA 和 GPU 加速器上的感知任务,我们选择 AMD 的 Kria KV260 FPGA 板和 NVIDIA 进一步改进 ROS 2 中的硬件加速 就感知而言,FPGA 的性能似乎明显优于其加速同类产品,但是,与可重新编程的硬件一样,这是以硬件-软件协同设计Nodes的复杂性为代价的。

    1.1K40编辑于 2022-05-01
  • 来自专栏云深之无迹

    DonkeyCar源码分析.2(官方硬件+相机处理)

    NREST,看电路图也是低电位置位 接着使用了2组SPI,给Neopixel输入的正极是给5V的电压,有SS34防止电流灌。 事实上,这个板子给了bin文件,我们自己也可以打板制作~使用UF2来更新固件。 看文档的意思是,这个不是C固件,而是mpy的固件. 如果没有错那就就是打印“打开”,接着是吧w和h作为元组打包成分辨率 因为硬件东西比较麻烦,所以都要使用try写,初始化,相机的初始化,把检测到的相机列表给l,这里我就不继续深入了,现在有点看不清电脑了 robotics-masters/mm1-hat-bootloader https://circuitpython.org/board/robohatmm1_m4/ https://github.com/adafruit/uf2-

    71220编辑于 2022-06-15
  • 来自专栏无所事事者爱嘲笑

    ionic2 处理android硬件返回按钮

    问题 注册安卓硬件返回按钮事件是必须的,因为用户不小心点击了返回按钮就退出app体验很不好,所以有几种方法: 1.实现按返回键最小化应用(最小化应用需要装cordova-plugin-appminimize 2.要么请求用户确认(添加一个Confirmation Alerts)。 3.按一下提示,按两下退出(加一个方法用toast提醒)。 这里用第三种展示。 }, 1); } //双击退出提示框 showExit() { if (this.backButtonPressed) { //当触发标志为true时,即2秒内双击返回按键则退出 mainTabs> <ion-tab [root]="tab1Root" tabTitle="Home" tabIcon="home"></ion-tab> <ion-tab [root]="tab<em>2</em>Root class TabsPage { @ViewChild('mainTabs') tabs:Tabs;//加这句以及引用两个模块 tab1Root: any = HomePage; tab<em>2</em>Root

    1.6K40发布于 2018-06-20
  • 来自专栏新智元

    揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

    凭借自研的硬件加速器LPU,达成了500个token/s的神级推理速度,当场秒杀了ChatGPT。 指令流水线(Instruction pipelining):将指令分为多个阶段,以流水线的方式执行,再次提高了指令吞吐量; - 多级缓存(Multiple levels of caches):CPU有2到 他们将功能单元移到核心之外,以2d网格方式排列。 网格的每一列只包含特定类型的功能单元,称为切片(slice)。下图显示了传统多核芯片和TSP在设计上的区别。 TSP编程模型依赖于两个关键要素: 硬件中的确定性数据路径 通过ISA获得的有关指令延迟的信息 编译器的后端可以跟踪片上任何流的位置和使用时间,称为软件定义硬件。 TSP的计算模型基于确定性硬件,所以整个分布式系统也应具有同样的确定性。 使用硬件对齐计数器同步TSP的时钟 每个TSP设备都包含一个称为硬件对齐计数器(HAC)的硬件计数器,溢出周期为256。

    90010编辑于 2024-03-13
  • 来自专栏韦东山嵌入式

    DshanMCU-R128s2硬件设计指南

    硬件设计指南 原理图设计 硬件系统框图 R128是一颗专为“音视频解码”而打造的全新高集成度 SoC,主要应用于智能物联和专用语音交互处理解决方案。 硬件系统基本工作原理 R128硬件系统基本工作流程如下: 硬件系统正常上电,主控复位之后,CPU开始执行 BROM固化代码,对系统资源和关键外设进行配置及初始化,包括电源,时钟,总线,复位,存储接口等。 时钟系统信号PIN说明 R128 硬件系统包含 DCXO 40M/RTC 32.768K 两个时钟,对应时钟信号说明如表所示。 EMI设计 产品设计设计当初,应了解硬件系统有哪些时钟信号,对这些信号加以防护,以提高产品 EMI性能,减少后续 DEBUG 成本。 R128 各模块主时钟频率如表所示。 多层板设计时,硬件系统上高速时钟线建议走内层;且较高速的单端的时钟线上均要预留 RC滤波电路,抑制高频分量,对于各模块时钟线进行包地处理。

    1.3K11编辑于 2023-12-26
  • 来自专栏GPUS开发者

    如何检测NVIDIA Jetson TX2硬件温度

    很多拿到Jetson TX2开发套件的人,第一次开机都会问:为啥风扇不转呢? ——其实没啥,就是运行温度不到一定程度,风扇是不会转起来的。 那如何测试TX2硬件温度呢? 1.打开终端,输入以下指令查看硬件 cat /sys/devices/virtual/thermal/thermal_zone*/type ? 2.输入以下指令查看温度,以下数字分别对应以上硬件,将数字除以1000得出实际温度(摄氏度) cat /sys/devices/virtual/thermal/thermal_zone*/temp ?

    3.8K20发布于 2018-08-01
  • 来自专栏计算机技术-参与活动

    揭秘区块链的未来加速器:Layer 2技术深度剖析

    目录Layer 2:区块链的隐形翅膀Layer 2:性能与效率的双重飞跃实战案例:Layer 2如何改变以太坊生态结语:Layer 2,区块链的未来已来揭秘区块链的未来加速器:Layer 2技术深度剖析在区块链的浩瀚宇宙中 让我们一起揭开Layer 2的神秘面纱,探索它如何携手区块链,共创未来新篇章。 Layer 2:性能与效率的双重飞跃性能飙升:Layer 2技术的核心使命之一,就是减轻主链(Layer 1)的负担,通过链下处理大量交易,将区块链的吞吐量提升至前所未有的水平。 结语:Layer 2,区块链的未来已来Layer 2技术,作为区块链的隐形翅膀,正引领着区块链技术向更高、更快、更强的方向发展。 未来,随着更多Layer 2技术的涌现和成熟,我们有理由相信,区块链将以前所未有的姿态,深刻改变我们的生活方式和商业模式。现在,就让我们共同期待这场由Layer 2技术驱动的区块链革命吧!

    56521编辑于 2024-09-14
  • 来自专栏文武兼修ing——机器学习与IC设计

    DianNao系列加速器总结(2)——存储与映射存储映射方法

    imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 第一种与k-NN(k-邻近算法)类似,每个数据的重用间隔(这一次使用和下一次使用之间的间隔数据数量 映射方法 映射方法指现有硬件加速器如何实现神经网络中的运算,包括卷积,池化和全连接层等。 DianNao与DaDianNao 由于DianNao和DaDianNao的论文中都没有明确阐述这两款加速器如何映射运算,因此以下内容均为个人推测 DianNao和DaDianNao的运算单元均为NFU 以下说明均使用$P_x=P_y=2$ 卷积 ShiDianNao的每个节点的简化图形如下所示,以下说明将使用该图示: ? ShiDianNao_node_model.png 实现卷积的第一步是初始化,将数据读入运算阵列,使用缓存读方式1或2: ?

    1.1K50发布于 2018-07-06
  • 来自专栏网络技术联盟站

    AI芯片设计与优化:算力提升、能耗降低与硬件加速器的发展趋势

    本文将详细介绍AI芯片设计与优化中的算力提升、能耗降低以及硬件加速器的发展趋势,并分析其对AI技术发展的影响。图片1. 2. 能耗降低能源效率是现代芯片设计中必须考虑的重点之一,AI芯片也不例外。能耗的降低既有助于提高芯片的发展速度,又有利于减少资源消耗。 硬件加速器的发展趋势为了满足日益增长的AI计算需求,硬件加速器成为了芯片设计与优化的重要方向之一。硬件加速器通过专门设计和优化的硬件结构,能够显著提升芯片的计算能力和能效比。 3.2 神经网络处理单元(Neural Network Processing Unit,NPU)NPU是一种专门用于神经网络计算的硬件加速器,具有高度的并行计算能力和低能耗的特点。 优化算力、降低能耗和发展硬件加速器是提高AI芯片性能的关键要素。随着技术的进步和需求的不断变化,AI芯片设计与优化的趋势将持续演进,并为各个行业带来更多的应用机会。

    2K30编辑于 2023-07-04
  • 来自专栏linux运维

    硬件维护问题:硬件维护不当,导致硬件故障

    检查当前硬件状态首先,我们需要检查当前系统的硬件状态。 -i hwinfo2. 常见的硬件维护问题及解决方案2.1 硬盘维护不当问题:硬盘维护不当,导致数据丢失或性能下降。解决方案:定期检查硬盘健康状态,备份重要数据。 2.7 环境维护不当问题:环境维护不当,导致硬件受潮或积尘。解决方案:保持良好的工作环境,避免潮湿和灰尘。示例:保持机房通风良好,使用防尘网和除湿器。3. 使用自动化工具进行硬件维护工具:Ansible介绍:Ansible 是一个自动化工具,可以用于远程管理和配置多台主机。

    95910编辑于 2025-02-07
  • 来自专栏云深之无迹

    ADMX3652 设计解剖 2.实物硬件补充

    使用两颗零漂移精密运放 ADA4523-1,将 ±10V 的单端输入信号 Vin 分别缓冲(A1、A2): 对称电阻分压后送入两个缓冲器。

    43910编辑于 2025-05-08
  • 来自专栏清菡软件测试

    2.浅谈计算机系统(硬件+软件)。

    2.有些计算机是非常复杂的。 二、计算机系统简介。 计算机系统的构成(硬件、软件)。 三、软件。 1.系统软件。 2.应用软件。 思维导图是清菡本人所画。 一、现代计算机系统是由哪两部分组成的? 实际上,可以忽略计算机的一些具体的特征,把计算机系统分成2部分。 计算机系统的构成(硬件、软件): 1)硬件:计算机的实体,如主机、外设等。 2)软件:由具有各类特殊功能的信息(程序)组成的。 软件是看不见的,软件存储在计算机当中,硬件是通过软件来发挥作用的。 硬件通过每一条指令的有序执行,来发挥作用。 经过编译链接以后,生成的可执行程序(目标程序),才能够在计算机的系统的硬件上去执行。 2)操作系统: 系统软件当中,最著名的就是操作系统。管理计算机的软硬件资源,提供人机交互。 2.应用软件: 按任务需要编制成的各种程序。 面向某一个特定的任务、某一个特定的目标而编制的这些程序,应用软件就更多了。 比如常常打的游戏,这些都可以看作应用程序。

    1.2K30编辑于 2023-02-28
  • 来自专栏施炯的IoT开发专栏

    ZigBee On Windows Mobile--2.硬件和软件设计

        继续上一篇”ZigBee On Windows Mobile--1.背景和结构”,今天来讲讲硬件和软件设计。硬件设计主要是做ZigBee模块,输出文件一般包括原理图和PCB图。 软件设计包括两部分,即ZigBee模块中的嵌入式程序和Windows Mobile端的应用程序,这两个软件模块运行在不同的平台之上,硬件上通过UART口进行通信。     ScheduleLoop()为主调度循环,根据状态来执行不同的任务,如下图2所示。 图2 主调度循环流程图     在Windows Mobile设备上运行的用户应用程序,主要执行信息交互和显示功能。 工程的运行环境:VS2005 with SP1+.NET CF SP2+windows mobile professional SDK 工程源代码下载:http://files.cnblogs.com/

    1K80发布于 2018-01-11
  • 来自专栏python开发者

    【CCD图像检测】2:黑白图像检测的硬件设计

    那么,要求滞后视频信号能在T0 = 3~5个RC内能够达到最值,而T0<3~4µs.大致算一下: 3*10-6 = 4*R2*510*10-12    得到R2=1.47K 能在3µs时间后,电压达到 原始跳变点的0.98    得到R2=1.96K 能在4µs(刚好是一个近处的黑线视频信号的宽度)时间后,电压达到原始跳变点的0.98     所以,一般 R2就取其中的某个值。 在实际中,配合LCD,调节R2电位器,结果发现R2=1.85K时有比较好的效果,符合理论计算结果。    关于R4参数的确定方法。 2.3.3.4硬件二值的应用展望。     硬件二值最大的特点是:输出的是模拟TTL电平信号,而这种信号是MCU所能处理和识别的电平信号,这就给硬件处理图像提供了很大的发展空间。 硬件层面: (1)将硬件二值后的视频信号直接进入单片机的输入捕捉模块,用硬件来提取我们关心的一些信息,然后再对这些数据分析计算出对自己有用的信息,这样一方面硬件为我们承担了一部分的数据处理,另外一方面,

    1.6K10编辑于 2022-05-10
领券