首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏OpenFPGA

    FPGAHDL 开发的 10规则

    HDL 开发的 10规则 编写良好的、可移植的、可重用的 HDL 代码,使设计能够以所需的频率实现,这绝对是一个挑战。 为此,许多(不是大多数)专业组织都有编码标准。 不过,编码规则可能会成为战场。一些公司的编码规则非常复杂,不仅控制代码结构,还控制格式和命名,而有些公司则稍微宽松一些。 但是,如果你是专业开发 FPGA,或者是作为爱好者,都应该有一些基本的编码规则。当你来到项目的后端并且必须实现时序收敛时,遵守这些基本规则可以节省大量时间和精力。 为此,我开始思考我的 HDL 开发的 10规则是什么?? 状态机——只是单个进程。忘记关于组合部分和顺序部分的学校和课程。所有状态机都应该是单个进程。 这些是我的 HDL 开发的前 10 条(好吧,12 条规则)。我很想知道如果是你,你会考虑添加哪些规则

    64020编辑于 2023-02-14
  • 来自专栏数据库相关

    成为DBA的10规则

    原文地址 https://datatechnologytoday.wordpress.com/2018/10/02/10-rules-for-succeeding-as-a-dba/ 成为一名成功的数据库管理员需要的不仅仅是技术敏锐性和对数据库系统的深入了解 规则3:自动化 - 如果可以自动化DBA流程,为什么要手动执行?您可以做的任何事情,可能都可以通过计算机更好地完成 - 如果它被编程为正确执行。 规则#5:集中精力 - DBA的工作很复杂,涵盖了许多不同的技术和功能领域。DBA很容易被某些任务所淹没 - 特别是那些不经常执行的任务。 规则10:在您的处置中使用所有资源 - 请记住,您不必自己做所有事情。使用您可以使用的资源。很多时候其他人已经遇到并解决了困扰你的问题。使用您的DBMS供应商的技术支持来帮助解决棘手的问题。 遵循此博客文章中提供的规则,以提高您作为DBA的成功率。

    60120发布于 2019-09-17
  • 来自专栏机器学习与python集中营

    语料库】中文公开聊天语料

    该库搜集了包含 chatterbot 豆瓣多轮 PTT八卦语料 青云语料 电视剧对白语料 贴吧论坛回帖语料 微博语料 小黄鸡语料 共8个公开闲聊常用语料和短信,白鹭时代问答等语料。 给出的语料原链接是为了说明该语料的原始出处是在哪里 环境 python3 处理过程 将各个来源的语料按照其原格式进行提取,提取后进行繁体字转换,然后统一变成一轮一轮的对话。 数据来源及说明 语料名称 语料数量 语料来源说明 语料特点 语料样例 是否已分词 chatterbot 560 开源项目 按类型分类,质量较高 Q:你会开心的 A:幸福不是真正的可预测的情绪。 ) 40W 开源项目,中国台湾PTT论坛八卦版 繁体,语料较生活化,有噪音 Q:为什么乡民总是欺负国高中生呢QQ A:如果以为选好科系就会变成比尔盖兹那不如退学吧 否 qingyun(青云语料10W 否 xiaohuangji(小黄鸡语料) 45W 原人人网项目语料 有一些不雅对话,少量噪音 Q:你谈过恋爱么 A:谈过,哎,别提了,伤心..。

    9.9K50发布于 2019-05-29
  • 来自专栏明天依旧可好的专栏

    原始语料

    第一步: 判断数据中是否存在重复数据 创建python文件– 代码框架 ''' author: kzb time: 2018-12-10 ''' import pandas as pd import

    1K30发布于 2019-01-22
  • 来自专栏Linux

    使用 firewalld 管理 Linux 防火墙规则(10个案例规则)

    Linux 服务器通常依赖 firewalld 来管理和配置防火墙规则,以确保系统的安全性和网络访问的高效性。 命令: firewall-cmd --permanent --add-service=dhcp 案例 10: VPN 服务 以 OpenVPN 为例,通常需要开放 1194 端口(UDP)。 命令: firewall-cmd --permanent --add-port=1194/udp 规则生效 在配置完所有规则后,别忘了重新加载 firewalld 以使规则生效: 命令: firewall-cmd --reload 总结 在本文中,您学习了如何通过 firewalld 配置 Linux 系统中的防火墙规则,以保护不同类型的服务。 我们深入探讨了如何为 Web 服务器、SSH 远程管理、数据库服务器、DNS 服务器等常见服务器角色配置和管理防火墙规则

    1.4K10编辑于 2025-01-17
  • 来自专栏机器学习AI算法工程

    文本分类中语料库的获取——搜狗语料

    这次主要总结搜过语料库的获取,因为老师要求20万数据,而我自己只爬了2万多,所以用到了搜狗的语料库. sougou_after2:存放加上<docs></docs>且处理了&的txt sougou_all:存放分好类的文档们 sougou_all的目录结构如下:这样就得到了文本分类所需要的数据集 这样,我得到了10

    3.3K80发布于 2018-03-14
  • AI语料库智慧教学平台:用AI技术解锁语料教学新生态

    传统语料教学中“资源零散难筛选、用法讲解不直观、练习反馈不及时”是长期痛点——教师要花大量时间整理语料、学生面对海量素材不知如何下手,很难实现“精准学、高效练”。 而AI语料库智慧教学平台的出现,凭借前沿AI技术,把“智能语料导师”搬进课堂,让语料教学更精准、互动、可落地,彻底重构语言学习逻辑。核心技术之一是NLP语义检索与解析技术,这是平台的“语料导航大脑”。 、语法规则,甚至标注语用禁忌。 不同于普通语料库的关键词匹配,平台的AI模型经过多语种、多场景语料训练,能理解“同义替换”“场景延伸”需求,比如搜索“道歉表达”会自动关联日常、商务、学术等不同语境的语料。 AI语料库智慧教学平台用NLP、大数据分析等核心技术,让语料资源“活”了起来,破解了传统语料教学的效率低、匹配差、互动弱等问题。

    45110编辑于 2025-10-29
  • 来自专栏全栈程序员必看

    10个Web设计的SEO规则建议收藏

    规则0:不要试图作*弊来提升SEO效果。 当你踏入一个房间;里面汇集了手拿各种博士文凭的科学家,你认为你会聪明过他们吗?当然不会。 这个规则是下面所有规则的基础,违反了这一规则,其他规则就无从谈起了。 高频率无意义的重复这些关键字和关键词是绝对禁止的,因为这违反了我们规则一中提到的“不作*弊”原则。 链接文字最好是这个链接的功能性描述,比如“10个CSS小技巧”或“如果通过实例提高你的SEO水平”。这个链接与当前页面的内容越相关,你这个页面就越容易被搜索到。所以,尽量少的链接一些不相关的网站内容。 规则七:图片标签的ALT属性也很重要 其实这一点是规则六和七的综合。如果页面中的图片与内容是相关联的时候,此点尤其重要,它说明你的网站内容很丰富,能够提高页面在搜索引擎中的权重。

    53310编辑于 2021-12-21
  • 来自专栏CPS推广奖励

    22年10月推广大使额外奖励规则

    【重要风控规则说明】推广大使应在腾讯云推广许可范围内,使用正当的手段方式进行推广,不应进行任何欺骗或虚假性质的推广行为,包括但不限于:1、与其他推广大使、或被推广客户相互串通,弄虚作假,恶意刷单,骗取活动奖励 同时满足以下条件订单可参与本次【推广个人客户总订单金额达标奖励】活动:1)订单类型为【客户首购】订单2)邀请客户类型为个人认证用户3)满足CPS返佣条件订单(详见CPS推广奖励规则)图片示例:某推广大使在 同时满足以下条件订单可参与本次【双月目标达成计划奖励】活动:1)客户类型为个人或企业认证客户2)订单类型为【客户首购】订单3)单笔订单金额≥¥704)满足CPS返佣条件订单(详见CPS推广奖励规则)图片注 :9月额外激励随9月月结结算;10月及双月额外激励随10月月结结算。 点击查看9月活动规则2、没来得及抽奖的次数还可以抽吗?获得的抽奖次数需要在10月8日23:59前进行抽奖,否则抽奖次数失效,默认您放弃抽奖机会。点击立即前往抽奖3、在哪里查看我的中奖记录?

    4K240编辑于 2022-11-10
  • 语料智能·知识无界:AI 多功能语料库检索平台重塑语言研究新范式

    语言研究进入智能检索新时代在全球化和数字人文研究蓬勃发展的背景下,传统语料库检索系统面临检索维度单一、多模态语料支持不足、深层语义关联缺失等核心挑战。 AI 多功能语料库检索平台通过融合大语言模型、多模态理解和知识图谱技术,构建了智能化、多维化、深度化的语料检索与分析体系,实现了从"关键词匹配"到"语义理解"的研究范式革新。 -检索-分析"四层技术架构:多模态语料处理引擎实现文本、语音、图像的统一表征学习;深度语义检索模型支持基于意图理解的智能检索;知识图谱关联系统构建语料间的语义网络;可视化分析平台提供丰富的语料数据洞察能力 数据安全与版权保护体系针对语料资源的版权敏感性,建立全方位保护机制:访问权限控制实现分级分权的语料访问;数字水印技术保护语料版权;操作日志审计追踪所有检索行为;数据脱敏处理在保护隐私的前提下开放研究。 、不断进化的新一代语料库研究基础设施。

    46610编辑于 2025-10-30
  • 来自专栏云计算D1net

    改善云安全性的10规则

    以下将重点介绍云安全的基本概念,并提出改善云安全性的10规则 责任共担模型 云中的安全性遵循一种称为责任共担模型的模式,该模式规定云计算提供商只对云平台安全负责,而客户则对云中的数据安全负责。 以下列出了在其安全策略中设置安全措施的10个最重要领域的列表,但首先需要解释云安全与传统的信息安全的不同之处。 改善云安全的10规则规则1:不要忽视开发人员的凭证 作为每天扫描数以百万计的公共和私人代码存储库的企业,再怎么强调健全的凭证策略的重要性也不为过。 ➤ 规则10:限制人工配置 利用云原生安全工具和控制意味着自动化。需要记住,漏洞源于错误配置,而错误配置就是一种错误。需要完成的人工工作越多,错误潜入的漏洞就越多。 以上提供了10规则来构建更好的云安全性,企业也可以自己制定防护措施。

    66820编辑于 2022-02-28
  • 来自专栏Vue中文社区

    面试的 10 大潜规则,你中招了吗!

    规则2:薪水要求高一点录取概率就大一点 我曾经面试一个刚毕业的大学生,简历上写的精通java,精通mysql,精通spring,然后我就问他你期望的薪水是多少呢? 他的回答是4K,先不说他简历上写的是真是假,但是有一点很明确,如果你在市场上去肉,别人都是卖30元一斤,而路边有个摆摊的只买10元一斤,那么你们会去买么? 可以从两个方面考虑一是工作年限,一般来说 初入行:8K到12K 1年到2年:10K到15K 3年到5年:13K到22K 5年以上:18K以上 当然,不同的地区有点差别,但差别应该不大 另一个方面是参考大公司的工资标准 潜规则9:选择大于努力的前提是先足够的努力才会有选择 很多人都在倡导选择大于努力,可更重要的往往更容易被忽略,那就是:只有足够的努力才会有选择。 潜规则10:人生苦短,绝不将就,必须去自己真心想去的公司 我遇到过很多人,在跟他们聊天时,他们都有类似的心理:一点都不想在这里上班,但是工作又不好找,只好暂时做着,这一做就是好几年;每天带着一种不愿意的心情上班

    87810发布于 2021-02-26
  • 来自专栏JasonhavenDai

    人民日报标注语料库(PFR)1.标记说明2.格式说明3.例子4.生语料库和熟语料库5.其他语料库汇总

    PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。 ,文件中每一行代表一自然段或者一个标题,一篇文章有若干个自然段,因此在语料中一篇文章是由多行组成的。 语料中除了词性标记以外,还有“短语标记”,这种情况一般出现在机构团体名称、成语等情况中。 /w 4.生语料库和熟语料语料库中存放的是在语言的实际使用中真实出现过的语言材料,语料库是以电子计算机为载体承载语言知识的基础资源,真实语料需要经过加工 、分析和处理之后才能成为可用的语料库 生语料库是指收集之后未加工的预料库 相对而言,熟语料库就是经过加工的 5.其他语料库汇总 http://blog.csdn.net/qq

    6K80发布于 2018-04-11
  • 来自专栏AI机器学习与深度学习算法

    实战语言模型~语料词典的生成

    sorted list iterable:是可迭代类型; cmp:用于比较的函数,比较什么由key决定; key:用列表元素的某个属性或函数进行作为关键字,有默认值,迭代集合中的一项; reverse:排序规则 fin.close() fout.close() ▲处理后的结果 对valid以及test样本同理使train中的方法即可: ▲数据处理以及处理后的结构 大致流程: 构建词汇表 需要在训练样本中统计语料中出现的单词

    1.6K00发布于 2020-06-01
  • 来自专栏深白小栈

    Nginx欺骗规则:设置正则跳转下载10G文件

    最开始想的是弄一个压缩炸弹,解压后就是几十G的文件,但是不对啊,它好多是bot爬,所以直接用301安排一个大文件是比较好的方法,于抄了一条规则,301跳转到一个10G大文件。 刚开始规则有问题,多亏了群里大佬帮忙改了一下。规则如下:   此处内容已隐藏,请评论后刷新页面查看.

    54430编辑于 2023-03-11
  • 来自专栏AI科技评论

    Facebook开源最大规模并行语料,45亿语料,覆盖576种语言对,或成为NMT评估标准

    首先,从语料来源上讲。 目前有几个公共的多语言并行语料库,主要来自一些国际会议(如European Parliament 、the United Nations)的语料,这些都是专业的人工翻译语料,使用语言较为正式,且仅限于政治主题 为了使并行语料库量大、覆盖主题广泛,Facebook在CCMatrix这项工作中,选择使用了随机抓取web中的数据作为并行语料的来源,他们每个月随机发送url,从而获得包含各种语言的网页快照(TB级)。 在当前版本的CCMatrix语料库中,作者限制为38种语言。 (编者注:这是11月份数据,当时数据集规模为35亿并行语料,下同) CCMatrix:每种语言对的并行语料数量(单位:百万),Margin阈值为1.06。

    53010发布于 2020-02-21
  • 来自专栏小小程序员——DATA

    关联规则 关联规则概述

    关联规则概述 关联规则 (Association Rules) 反映一个事物与其他事物之间的相互依存性和关联性。 关联规则可以看作是一种IF-THEN关系。假设商品A被客户购买,那么在相同的交易ID下商品B也被客户挑选的机会就被发现了 购物车分析是大型超市用来揭示商品之间关联的关键技术之一。

    89510编辑于 2023-12-18
  • 来自专栏AI研习社

    Facebook开源最大规模并行语料,45亿语料,覆盖576种语言对,或成为NMT评估标准

    首先,从语料来源上讲。 目前有几个公共的多语言并行语料库,主要来自一些国际会议(如European Parliament 、the United Nations)的语料,这些都是专业的人工翻译语料,使用语言较为正式,且仅限于政治主题 为了使并行语料库量大、覆盖主题广泛,Facebook在CCMatrix这项工作中,选择使用了随机抓取web中的数据作为并行语料的来源,他们每个月随机发送url,从而获得包含各种语言的网页快照(TB级)。 在当前版本的CCMatrix语料库中,作者限制为38种语言。 (编者注:这是11月份数据,当时数据集规模为35亿并行语料,下同) CCMatrix:每种语言对的并行语料数量(单位:百万),Margin阈值为1.06。

    1.4K20发布于 2020-02-21
  • 大模型语料标注需要注意哪些?

    一、语料类型 1.自采语料 2.商业语料 3.开源语料 二、抽检要求 1.人工抽检要求 具体做法:从全部语料中随机抽取不少于 4000 条语料:合格标准:合格率不应低于96%。 以此来保证语料在人工抽检环节的质量水平。 2.技术抽检要求 结合关键词、分类模型等技术进行抽检抽样数量:从全部语料中随机抽取不少于总量 10%的语料。 合格标准:抽样合格率不应低于98%,保障技术抽检的语料质量。 3. 评估技术规范要求 规范内容:评估采用的关键词库、分类模型应符合文件要求。 确保在使用关键词、分类模型等技术进行语料抽检时,所使用的工具和模型是符合既定规范和标准的,从技术层面保障语料安全评估的科学性和准确性。 三、大模型上线备案测试通道需求: 1.大模型产品服务下载通道与测试账号-附加审核策略(10个) 2.大模型产品服务下载通道与测试账号-不附加审核策略(10个) 3.支持生成文本的大模型产品,需要提供API

    33810编辑于 2025-09-04
  • 来自专栏算法channel

    一种获取NLP语料的基本方法

    学习自然语言处理,语料获取是第一步,那么如何抓取和提取语料呢,本文提供一种思路。 维基百科语料库 维基百科会定期把各种语言的百科网页全部打包存储起来,这里我们选择其中的中文维基百科网页,这个文件可以作为中文语料库来使用。 可以参考 ISO 639-1语言列表,相应替换便能找到对应语料。 Refernces https://zh.wikipedia.org/wiki/ISO_639-1 https://jdhao.github.io/2019/01/10/two_chinese_corpus / https://jdhao.github.io/2019/01/10/two_chinese_corpus/ 这些内容我已经同步整理到 Python中文网,欢迎电脑端登入收藏,以备后面使用。

    2.6K20发布于 2021-03-12
领券