首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏新智元

    拿下SOTA!最强中文Embedding模型对标OpenAI,技术路线公开

    与上一代(Piccolo)相比, Piccolo2 主要利用高效的多任务混合损失训练方法,有效地利用来自不同下游任务的文本数据和标签。 同时,Piccolo2 扩大了嵌入维度,并使用 MRL 训练来支持更灵活的向量维度。除了训练方法之外,Piccolo2 还利用了一个数据合成框架和难负挖掘方法,以不断扩充数据集的数量和质量。 对于检索任务,Piccolo2采用标准的InfoNCE损失: 对于句对分类、句对相似度任务,Piccolo2采用排序损失: 对于分类、聚类任务,Piccolo2首先通过将文本的label视为正/负样本, 高质量数据加持精度 Piccolo2的微调数据主要来自于开源社区和GPT-4生成的合成数据。同时,对于检索任务,Piccolo2也应用了难负样本挖掘来扩充数据质量。 /piccolo-large-zh-v2

    1.2K10编辑于 2024-06-17
  • 来自专栏Rust语言学习交流

    【Rust日报】Piccolo - 用纯Rust实现的无栈Lua虚拟机

    Piccolo - 用纯Rust实现的无栈Lua虚拟机 Piccolo,原名luster,在经过数年的中断后,于2023年4月悄然恢复了开发。 曾经开发过 rlua 的 kyren,在底层 gc-arena crate 取得突破后,回到了 piccolo 项目。 如今两个重要版本的发布了:piccolo v0.3.0 和 gc-arena v0.5。 Piccolo项目的目标,按大致优先级降序排列: 成为一个可以工作、有用的 Lua 解释器。 ReadMore: https://github.com/kyren/piccolo/releases/tag/v0.3.0 使用 Rust 生成 IP 地址的 PNG 图片 看起来像是这样: 原文是一个详尽的教程

    51810编辑于 2024-01-05
  • 来自专栏Rust语言学习交流

    【Rust日报】Luminal:在 Rust 中编译快速 GPU 内核

    Piccolo - 主要用 Safe Rust 编写的 Stackless Lua 解释器 https://kyju.org/blog/piccolo-a-stackless-lua-interpreter 完成了一篇计划好的博客文章,介绍 Lua 运行时piccolo,我想在这里分享它。 这并不是一个使用piccolo或贡献的广告piccolo,而是关于无堆栈解释器、垃圾收集、解释器设计和(某种程度上)写给协程的情书的想法的集合。 它也是一个演示piccolo及其独特之处,并且博客文章上有一些示例供您在实时 REPL 中尝试。 Luminal:在 Rust 中编译快速 GPU 内核 大家好!

    49510编辑于 2024-05-10
  • 来自专栏ops技术分享

    编译工具sbt部署

    二.部署 1.下载并放到/usr/local wget https://piccolo.link/sbt-1.1.5.tgz``tar -xf sbt-1.1.5.tgz``mv sbt /usr/local

    1.1K50发布于 2021-05-28
  • 来自专栏开源服务指南

    加速 Docker 镜像下载:稳定可靠、简洁有效 | 开源日报 No.281

    2、msgspec 和 attrs 分层参数声明 自动 API 文档化 Trio 支持(内置,通过 AnyIO) 使用 msgspec 进行超快速验证、序列化和反序列化 SQLAlchemy 集成 Piccolo

    1.3K40编辑于 2024-06-25
  • 来自专栏生物信息与临床医学专栏

    Meta分析之文献检索与筛选

    参考文献: Koskinas KC, Siontis GCM, Piccolo R, Mavridis D,Räber L, Mach F, Windecker S: Effect ofstatins

    2.7K30发布于 2020-08-06
  • 来自专栏网络安全【故里】

    Ugra CTF Quals 2023

    onyx_orca/mountain_moose/deadly_device/jade_tiger/spinning_koala/revealing_packet/nacre_android/onyx_piccolo uncanny_hammerhead/covert_hail/blue_foal/emerald_chef/explosive_gazelle/desert_robot/rowdy_lion/urban_piccolo dangerous_hammer/space_flute/space_mask/flying_crab/spinning_jackal/untouchable_compressor/tarnished_piccolo onyx_orca/mountain_moose/deadly_device/jade_tiger/spinning_koala/revealing_packet/nacre_android/onyx_piccolo dangerous_hammer/space_flute/space_mask/flying_crab/spinning_jackal/untouchable_compressor/tarnished_piccolo

    44930编辑于 2023-04-21
  • 来自专栏张善友的专栏

    Professional K2 blackpearl

    而K2 Insiders 成员Jason Apergis、Sergio Del Piccolo、Chris O'Connor、Igor Macori、Gabriel Malherbe、Jason Montgomery

    1.1K90发布于 2018-01-31
  • 来自专栏生信技能树

    TCGA数据库的normal样本不够可以拿GTEx来凑

    //jhubiostatistics.shinyapps.io/recount/) 作者把这5个流程应用到TCGA和GTEX,得到10个不同组合的数据 GDC (GDC-Xena/Toil, GDC-Piccolo

    7K44发布于 2020-07-14
  • 来自专栏Debug客栈

    一些好玩的代码构图

    ._ | _.d############# "Piccolo" no. 2 (from Dragonball Z) --- Steven J.

    1.3K20发布于 2019-12-24
  • 来自专栏生物信息与临床医学专栏

    Meta分析系列之传统meta分析

    Koskinas KC, Siontis GCM,Piccolo R, Mavridis D, Räber L, Mach F, Windecker S: Effect of statins and non-statin

    2.2K10发布于 2020-08-06
  • 来自专栏灵墨AI探索室

    我掌握的新兴技术:构建智能问答系统之实战篇

    在这里,我们选择了HuggingFaceEmbeddings中的sensenova/piccolo-base-zh模型作为示例,当然你也可以选择其他模型,这里没有限制。 langchain.embeddings import HuggingFaceEmbeddings from langchain.vectorstores import Milvus model_name = "sensenova/piccolo-base-zh

    60942编辑于 2024-02-05
  • 来自专栏生信菜鸟团

    每周文献分享第一季完结撒花暨第65期分享

    jhubiostatistics.shinyapps.io/ recount/) 作者把这5个流程应用到TCGA和GTEX,得到10个不同组合的数据 GDC (GDC-Xena/Toil, GDC-Piccolo

    68740发布于 2020-06-24
  • 来自专栏木鸟杂记

    Spark 理论基石 —— RDD

    现有的一些基于集群内存的系统,比如分布式KV、共享内存、Piccolo 都提供一种可以细粒度的修改的可变数据集抽象。为了支持这种抽象之上的容错,就需要进行数据多机冗余或者操作日志备份。 DSM 在这里是一个很宽泛的抽象,不仅包括一般的内存共享系统,还包括其他支持细粒度的状态更新的框架,比如说 Piccolo、分布式数据库等。 如数据库 RAMCloud , Percolator 和 Piccolo。RDD 的目标在于批量分析型应用,而将这些异步应用的需求留给那些专有系统。

    1.2K20发布于 2021-09-26
  • 来自专栏about云

    spark入门基础知识常见问答整理

    在这种定义下,DSM不仅包括了传统的共享内存系统,也包括了像提供了共享 DHT(distributed hash table) 的 Piccolo 以及分布式数据库等。 8.RDD的优势?

    1.6K100发布于 2018-03-27
  • 来自专栏AILearning

    Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN

    需要注意的是, 依据这个定义, 我们所说的 DSM 系统不仅包含了传统的共享内存系统, 还包含了对共享状态的细粒度写操作的其他系统(比如 Piccolo), 以及分布式数据库. 比如使用数据库、RAMCloud、Percolator 以及 Piccolo. 比如, Piccolo 使的用户通过分布式的函数来读取和更新分布式 hash 表中的单元格数据. DSM 和像 RAMCloud 这样的 key - value 存储系统提供了类似的模型. 第二, Piccolo 和 DSM 通过 checkpoint 和回滚机制实现容错, 在许多应用中这种机制比机遇血缘机制的 RDDs 的容错的成本更大. [27] R.PowerandJ.Li.Piccolo:Buildingfast,distributedprograms with partitioned tables. In Proc.

    1.2K90发布于 2017-12-29
  • 来自专栏Soul Joy Hub

    深入理解Spark 2.1 Core (一):RDD的原理与源码分析

    (注意这里的DSM,不仅指传统的共享内存系统,还包括那些通过分布式哈希表或分布式文件系统进行数据共享的系统,比如Piccolo[28](注:Spark生态系统中有一名为Alluxio的分布式内存文件系统 不适合那些通过异步细粒度地更新来共享状态的应用,例如Web应用中的存储系统,或者增量抓取和索引Web数据的系统,这样的应用更适合使用一些传统的方法,例如数据库、RAMCloud[26]、Percolator[27]和Piccolo

    1.1K70发布于 2019-02-13
  • 来自专栏张红林的专栏

    大规模机器学习框架的四重境界(下)

    Architecture for Parallel Topic Models Scaling Distributed Machine Learning with the Parameter Server Piccolo

    2.7K11发布于 2017-08-31
  • YOLOv11助力结肠镜检查:精准息肉检测新突破

    该模型在SUN poly和PICCOLO数据库上进行了训练和测试。Lee等人引入了基于YOLOv4的多尺度网格,以有效检测小息肉。

    73210编辑于 2025-03-06
  • 来自专栏大数据进阶

    【转】分布式数据流的轻量级异步快照

    另一方面,有状态的数据流系统,如Naiad、SDGs、Piccolo和SEEP[3、5、11、12][3、5、11、12](它们也是我们在这项工作中的主要关注点),使用checkpoint检查点获取故障恢复的全局执行的一致快照 Piccolo: Building fast, distributed programs with partitioned tables.

    1.2K21发布于 2019-09-17
领券