首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏每月技术成长

    C930、RVV、matrix extension

    软件生态的困境 虽然硬件生态日益完善,但 RISC-V的软件生态仍然面临着诸多困难 RVV 尽管 RVV 1.0 已经发布并进入 RVA22 profile,且在 RVA 23 profile 中成为默认 extension,RVV 1.0 的软件生态仍然相当贫瘠。 主流编程语言支持:仅有c、c++、Dragonwell JDK 支持 RVV 1.0(部分编程语言仍在计划支持 SVE/ SVE2,RVV 的支持仍然需要两三年时间) 主流算法库支持:仅有Google highway、ncnn 、 OpenBLAS 、OneDnn等少数库支持 RVV 1.0,且特性不够稳定 主流 AI 框架支持:Pytorch 的 RVV patch 仍未合并进入主线Matrix extension x86 的 AVX512,但相对于 x86 丰富的生态,C930 的 RVV extension 使用难度相当大,需要更多开发者们在将来进行更多的适配。

    43800编辑于 2025-03-03
  • 来自专栏Rust语言学习交流

    【Rust 日报】2022-02-03 《Rust Magazine 中文精选 2022》

    Rust 周报 428 ReadMore:https://this-week-in-rust.org/blog/2022/02/02/this-week-in-rust-428/ RVV 编码器 rvv-encode RISC-V V 扩展指令库 rvv-asm RISC-V V 扩展指令过程宏 rvv-as RISC-V V 扩展指令的命令行工具 rvv-asm例子 unsafe { rvv_asm::rvv_asm 用法 USAGE: rvv-as [OPTIONS] <ASM_FILE> ARGS: <ASM_FILE> The original assembly source file The comment prefix [default: #] -r, --reserved-only Only translate reserved rvv instructions ReadMore:https://github.com/TheWaWaR/rvv-encoder ---- From 日报小组 冰山上的 mook && Mike

    35120编辑于 2022-03-28
  • 来自专栏嵌入式iot

    D1 riscv芯片上运行rt-thread进行RVV性能评估

    D1 riscv芯片上运行rt-thread进行RVV性能评估 概述 rt-thread在D1芯片上的移植 如何开启D1&&D1s的rvv扩展 RVV性能对比评估 RVV在RTOS如何使用的更好 概述 D1 && D1s(f133)采用的是平头哥C906的core,上面已经支持了RVV 0.7.1版本,虽然目前RVV1.0已经frozen,这就意味着上游编译器或者一些相关的生态软件将支持RVV1.0, 但是作为性能评估RVV0.7.1与RVV1.0影响并不大。 下面的文章主要描述如何在D1 && D1s芯片上运行rt-thread,并且描述如何开启RVV,同时对RVV性能进行一个简单的评估,最后讨论RVV如何与RTOS使用的问题。 RVV性能对比评估 riscv 的RVV其编程模型主要有两种方式,第一种采用rvv-intrinsic。这就是在编译器中进行intrinsic函数的构建,可以将相关的rvv操作变成编辑器的内置函数。

    1.9K31编辑于 2022-03-04
  • 来自专栏全志嵌入式那些事

    在全志D1开发板上玩ncnn

    代码 删除 -D__riscv_zfh=1,arch 参数的 zfh 中已经指代 放在 ncnn/toolchains/c906-v222.toolchain.cmake 0x2 工具链修复 因为 rvv -0.7 缺少某些指令支持,遇到一些 rvv-1.0的代码会生成 unknown op fneg frec7 frsqrt7 因此要修改下工具链头文件 打开 Xuantie-900-gcc-linux- (_RVV_FLOAT_UNARY_OP, rec7) _RVV_FLOAT_ITERATOR_ARG (_RVV_FLOAT_UNARY_OP, rsqrt7) _RVV_FLOAT_ITERATOR_ARG (_RVV_FLOAT_UNARY_OP, neg) 注释掉 // _RVV_FLOAT_ITERATOR_ARG (_RVV_FLOAT_UNARY_OP, rec7) // _RVV_FLOAT_ITERATOR_ARG (_RVV_FLOAT_UNARY_OP, rsqrt7) // _RVV_FLOAT_ITERATOR_ARG (_RVV_FLOAT_UNARY_OP, neg) 找到文件末尾的三个 #endif

    34110编辑于 2024-02-24
  • 来自专栏每月技术成长

    k1/m1 or k230

    k1/m1 与 k230/k230D 均是 近两年发布的 riscv 芯片,均支持 RVV 1.0,本文将对两者进行对比硬件对比项k1/m1k230/k230Dcpu 频率1.6/1.68GHz1.6GHz (大核) 800MHz(小核)cpu 核数8 core2 core(大小核,仅大核支持 RVV)cpu 算力50 KDMIPS (1.3x a55)-----RVV 规格256 bit128 bitAI

    49500编辑于 2025-04-20
  • 来自专栏每月技术成长

    RISC-V and HPC

    SG2042 and SG2042SG2042 与 SG 2044 均是算能推出的 12nm 64 core RISC-V 服务器级 SOC,SG2042 基于 玄铁 C910 IP 核,支持 RVV 而 SG2044 则基于玄铁 C920 ip 核,支持 RVV 1.0、T-head Martix Extension。 尽管 RISC-V GeekBench 6 跑分中表明 SG2044在 RVV 1.0 加持下,跑分明显高于其他基于 RISC-V 的设备,但同样不容忽略的是:SG2042 (64 core) 的多核跑分竟然不如树莓派

    74600编辑于 2025-02-14
  • 来自专栏嵌入式iot

    用哪吒D1开发板体验riscv向量底层编程

    D1开发板体验riscv向量底层编程 1.前言 2.机器模式处理器状态寄存器(MSTATUS) 3.编译选项支持V扩展 4.RISCV向量计算的原理 5.通过实例分析RISCV V扩展的运作机制 6.RVV 使用体验 1.前言 RISCV V扩展即向量指令扩展(RVV),这部分作为研究AI加速计算领域有着非常关键的作用。 既然的D1支持了rvv扩展(0.7.1,最新的版本已经0.10版本),那么就实际的从底层原理角度分析一下使用的流程。 下面会通过一个裸机代码入手,结合实战去展示riscv rvv的使用。 RVV还有一个特性就是寄存器的扩充,比如D1采用的玄铁C906的核,支持的是32个128位的向量寄存器,也可以将两个或多个向量寄存器拼成一个来使用。

    2K40发布于 2021-07-01
  • 来自专栏嵌入式iot

    riscv gcc工具链是如何被编译的

    工具链的构建顺序 riscv gcc编译器的目录结构 riscv gcc编译器的构建 编译最小支持RVB和RVV的riscv gcc 概述 gcc工具链是一个复杂而又巧妙的工程,随着riscv上层软件的逐渐完善 但是现在做riscv扩展指令集分析,这里选择 https://github.com/riscv-collab/riscv-gnu-toolchain/tree/basic-rvv 该分支实现了也就是riscv clone https://github.com/riscv-collab/riscv-gnu-toolchain.git cd riscv-gnu-toolchain git checkout basic-rvv 编译最小支持RVB和RVV的riscv gcc 可以选择下面的配置 . with-cmodel=medany --with-multilib-generator="rv64gcv_zba_zbb_zbc_zbs-lp64d--" make -j $(nproc) 这里的RVV

    2.5K40编辑于 2022-01-10
  • 来自专栏芯智讯

    进军服务器市场,RISC-V能否与X86一战?

    虽然GNU存储库包含一个rvv下一个分支,其目的是支持rvv v1.0,但在研究人员撰写研究报告时,它并没有得到积极维护。 此外,还有一个针对rvv v0.7.1的rvv-0.7.1分支,但该分支已被删除。 T-Head的定制编译器同时支持RVV v0.7.1和他们自己定制的自定义扩展。 该版本的编译器生成矢量长度特定(VLS)RVV组件,该组件专门针对C920的128位矢量宽度。所有内核都在优化级别三进行编译,所有报告的结果都在五次运行中取平均值。 对于下一代高性能RISC-V处理器来说,研究人员认为,提供RVV v1.0将非常有用,因为这将提供使用用于编译矢量化代码的主线GCC和Clang。

    97030编辑于 2023-09-20
  • 来自专栏开源部署

    if高级用法

    /bin/bash #Author: www.zutuanxue.com #Created Time: #Script Description: for var in ab ac rx bx rvv

    60820编辑于 2022-09-15
  • 来自专栏Banana PI开源硬件

    Banana Pi BPI-CM6 是一款八核 RISC-V 模块,兼容 Raspberry Pi CM 载板

    OpenGL ES3.2、Vulkan 1.3、OpenCL 3.0;20 GFLOPSVPU – H.265 和 H.264 1080p60 解码/编码NPU——无,但 RISC-V 内核可通过 RVV 1.0 扩展提供高达 2.0 TOPS(INT8)的性能符合 RVA 22 规范 RVV 1.0系统内存 – 8GB 或 16GB LPDDR4x存储 - 8GB、16GB、32GB 或 128GB

    26700编辑于 2025-05-28
  • 来自专栏一朵灼灼华的博客

    win10激活(一)

    4B4GP-2HD89-7XMP6 2BXNW-6CGWX-9BXPV-YJ996-GMT6T NRTT2-86GJM-T969G-8BCBH-BDWXG XC88X-9N9QX-CDRVP-4XV22-RVV26

    3.2K10编辑于 2022-08-05
  • 来自专栏小狐狸说事

    win11怎么免费激活 快速激活win11的方法(附win11激活密钥)

    4B4GP-2HD89-7XMP6 2BXNW-6CGWX-9BXPV-YJ996-GMT6T NRTT2-86GJM-T969G-8BCBH-BDWXG XC88X-9N9QX-CDRVP-4XV22-RVV26

    51.2K93编辑于 2022-11-16
  • 来自专栏嵌入式iot

    全志D1开发板(哪吒 RISCV64)开箱评测

    2.支持RVV 这个也较为关键,在RISCV中对于多媒体加速指令上,采用的是V扩展,也就是RISCV V-extension。 目前支持的RVV版本 v0.7版本,最新的正式发布版本为v0.10版本。 有了V扩展,意味着计算性能的提升,此时图像处理、音视频处理的性能将大幅度的提升,做AI应用,也是非常好的选择。

    5.4K50发布于 2021-07-01
  • 来自专栏优图实验室的专栏

    腾讯优图ncnn新版本适配国产CPU,最高速度提升70倍

    龙芯 是中国科学院计算所自主研发的通用CPU,采用自主LoongISA指令系统,兼容MIPS指令 D1 是全志科技首款基于RISC-V指令集的芯片,集成了阿里平头哥64位C906核心,支持RVV 本次ncnn

    1.8K10发布于 2021-07-23
  • 来自专栏深度学习与python

    玄铁首款服务器级 CPU 下月交付:性能达服务器级,搭载 Matrix AI 引擎

    此外,C930 搭载 512 bits RVV1.0 和 8 TOPS Matrix 双引擎,将通用高性能算力与 AI 算力原生结合,并开放 DSA 扩展接口以支持更多特性要求。 具体而言,C908X 定位为玄铁首款 AI 专用处理器,支持 4096 bits 超长数据位宽 RVV1.0 矢量扩展;R908A 面向车规级芯片的高可靠需求;XL200 则将提供更大规模、更高性能的多簇一致性互联

    41310编辑于 2025-03-10
  • 来自专栏Windows技术交流

    云服务器通过硬盘安装方式安装win10

    -4B4GP-2HD89-7XMP62BXNW-6CGWX-9BXPV-YJ996-GMT6TNRTT2-86GJM-T969G-8BCBH-BDWXGXC88X-9N9QX-CDRVP-4XV22-RVV26TNM78

    8.7K31编辑于 2022-10-11
  • 嵌入式软件工程师

    五、未来趋势:RISC-V 与 AI 的化学效应专用指令集扩展:针对 Transformer 模型的 RVV 向量加速。 存算一体芯片:基于 RISC-V 的模拟计算突破能效比瓶颈。

    27910编辑于 2025-11-25
  • 来自专栏钱塘小甲子的博客

    【转】卡尔曼滤波器

    w=randn(1,N) x(1)=0; a=1; for k=2:N; x(k)=a*x(k-1)+w(k-1); end V=randn(1,N); q1=std(V); Rvv c=0.2; Y=c*x+V; p(1)=0; s(1)=0; for t=2:N; p1(t)=a.^2*p(t-1)+Rww; b(t)=c*p1(t)/(c.^2*p1(t)+Rvv

    1.2K50发布于 2019-01-29
  • 来自专栏机器之心

    开源的胜利!RISC-V与AI今日全面「会师」

    此外,C930 搭载 512 bits RVV1.0 和 8 TOPS Matrix 双引擎,将通用高性能算力与 AI 算力原生结合,并开放 DSA 扩展接口以支持更多特性要求。 具体而言,C908X 定位为玄铁首款 AI 专用处理器,支持 4096 bits 超长数据位宽 RVV1.0 矢量扩展;R908A 面向车规级芯片的高可靠需求;XL200 则将提供更大规模、更高性能的多簇一致性互联

    34710编辑于 2025-02-28
领券