首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏我的机器学习之路

    Python处理Excel文档

    这里用到一个名为xlrd的库,我用来筛选教师编制考试的信息,表格实在太大了,用Excel标注完了删除都要删半天,为此特地学了一下午:

    67410发布于 2020-10-23
  • 来自专栏码生

    图片处理(收集文档

    通过Core Library的文档,我们知道创建颜色有这么几个方法: CGColorCreate CGColorCreateCopy CGColorCreateGenericGray CGColorCreateGenericRGB

    1.7K30发布于 2018-11-21
  • 来自专栏自动化、性能测试

    MongoDB(10)- 查询嵌套文档

    75, size: { h: 22.85, w: 30, uom: "cm" }, status: "D" }, { item: "postcard", qty: 45, size: { h: 10 换了个字段顺序就查不到同一条文档了 查询嵌套字段 要在嵌入/嵌套文档中的字段上指定查询条件,语法格式如下 "field.nestedField" 跟 JSON 取值一样,用 . ,找到嵌套文档的 h 字段值等于 in 的所有文档 栗子二:嵌套字段结合单个查询条件操作符 > db.inventory.find( { "size.h": { $lt: 15 } } ) { "_id } { "_id" : ObjectId("60b5e622dd6e93ee8bf35aa1"), "item" : "postcard", "qty" : 45, "size" : { "h" : 10 , "w" : 15.25, "uom" : "cm" }, "status" : "A" } size 字段值是一个文档,找到嵌套文档的 h 字段值小于 15 的所有文档 栗子三:多个不同嵌套字段结合

    2.4K21发布于 2021-06-09
  • 来自专栏海天一树

    LDA处理文档主题分布

    这篇文章主要是讲述如何通过LDA处理文本内容TXT,并计算其文档主题分布。 10个词“联欢晚会”在第0行里出现了1次。 (六)文档-主题分布 type(doc_topic): <class 'numpy.ndarray'> shape: (10, 2) [0.02380952 0.97619048] doc: 0 topic 篇文档,分为两个主题。 哪个概率大说明这个文档的主题是哪个。 最终10篇文章分别对应于主题1, 1, 0, 0, 1, 1, 0, 0, 1, 0。 ? doc_topic.png 这里列出了其中6个文档的主题分布图。

    1.8K30发布于 2018-07-25
  • 来自专栏九陌斋

    文档处理与查询设计

    即首先将文档提取到一个文件内,然后遍历处理即可。 框架图 功能说明 文档处理(语言及其他处理) 包括文档格式处理文档语言识别、文档编码识别,即在文本分类索引之前,先对文档进行预处理。 如果结果 < k 篇文档,那么从下一层继续处理,直至索引用完或者返回至少k 个结果为止。 查询处理 给定查询 Q, 找离它最近的先导者L,从L及其追随者集合中找到前K个与Q最接近的文档返回。 以词项为单位的处理方式 通常包括词条化、中文分词、处理停用词、词条归一化成词项,是指将词类经过一系列处理之后形成用于处理的词项。

    99950编辑于 2022-12-26
  • 来自专栏逻辑熊猫带你玩Python

    使用Python处理Word文档

    使用Python处理Word文档 1. 前言2. 使用Document对象创建文档3. 在word文档中使用标题4. 在word文档中使用段落5. 在word文档中使用列表6. 在word文档中使用表格7. 在word文档中使用章节8. 在word文档中使用分页9. 在word文档中使用图片10. content # 1 2 3 # 2 4 6 # 3 6 9 # ------- table.add_row() # 在最下方添加行 table.add_column(10 ) # 在最右边添加列,列宽设置为10 print(len(table.rows)) # 4 print(len(table.columns)) import Document document = Document() document.add_picture('编程杂艺.png') document.save("6-使用图片.docx") 10

    8.1K43发布于 2019-09-03
  • 来自专栏Linux技术资源分享

    Python处理Excel文档之openpyxl

    ****openpyxl简介**** 还是简单一句:顾名思义,openpyxl就是一个处理excel文档的一个python库。 path) # 也可以将文件作为模板保存 as_template默认为False wb.save('document_template.xltx', as_template=True) 简单的样式处理 'center') ws.cell(row=deng_lu_taskRow, column=index + 3).alignment = align # 字体大小 font = Font(size=10

    1.4K40发布于 2018-06-08
  • 来自专栏机器学习AI算法工程

    图像处理文档矫正DocTr++

    、介绍 Doctr++除了提出一种新的architecture外,most importantly,提出了一种新的数据处理方式,解决了以前文档矫正只能处理带有边界信息的完整文档,文章通过数据处理定义了三种类型的训练数据 图1展示了三类常见的形变文档图像:(a) 包含完整文档边界,(b) 包含部分文档边界,(c ) 不包含文档边界。 **实验发现,每一个矫正提示向量会关注输入形变文档图像中的某一特定区域,这些区域组合起来便覆盖整张输入图像。 三、评价指标 论文提出了两种新的评价指标 MSSIM-M 和 LD-M,用于通用形变文档图像矫正质量的评估。 为了实现优秀的矫正效果,DocTr++采用了一种多尺度编解码器结构,构建各类形变文档图像与无形变文档图像之间的逐像素映射关系。

    98210编辑于 2024-06-08
  • 来自专栏毛利学Python

    图像和办公文档处理

    图像和办公文档处理 用程序来处理图像和办公文档经常出现在实际开发中,Python的标准库中虽然没有直接支持这些操作的模块,但我们可以通过Python生态圈中的第三方模块来完成这些操作。 用Pillow操作图像 Pillow是由从著名的Python图像处理库PIL发展出来的一个分支,通过Pillow可以实现图像压缩和图像处理等各种操作。可以使用下面的命令来安装Pillow。 pip install pillow Pillow中最为重要的是Image类,读取和处理图像都要通过这个类来完成。 Word文档 利用python-docx模块,Python可以创建和修改Word文档,当然这里的Word文档不仅仅是指通过微软的Office软件创建的扩展名为docx的文档,LibreOffice Writer 和OpenOffice Writer都是免费的字处理软件。

    69030编辑于 2022-08-18
  • 来自专栏学习笔记持续记录中...

    JDBC 处理Blob(10

    Mysql中,Blob是一个二进制大型对象,是一个可以存储大量数据的容器,它能容纳不同大小的数据

    1.3K20发布于 2020-03-17
  • 来自专栏站长的编程笔记

    rust语言处理含有中文内容文档处理方法

    在Rust中处理包含中文内容的文本文件时,确保正确处理文件的编码非常重要。通常情况下,中文文本文件使用UTF-8编码,但有时也可能使用其他编码,比如GBK。 在Rust中,你可以使用第三方库encoding来处理不同的文本编码。 以下是一个简单的例子,展示了如何读取包含中文内容的文本文件并处理不同的编码: 首先,将 encoding 添加到你的 Cargo.toml 文件中: [dependencies] encoding =  ("Failed to decode the file content");         }     }     Ok(()) } 实际上你可能需要根据具体情况进行更复杂的处理

    1.1K10编辑于 2023-12-23
  • 来自专栏ComPDFKit tutorials

    ComPDFKit - 专业的PDF文档处理SDK

    标记密文 对图像、文本和矢量图形中的敏感信息或隐私数据进行不可逆的密文处理,阻止了他人访问敏感信息。同时支持多种方式标记密文。 PDF文档对比 提供文档对比功能,对比相似的或不同版本的PDF文档。支持对比文档中的文字、图片、线条等内容。以不同颜色展示PDF文档的编辑、删除、增加等变动。 PDF文档拆分 提供API接口,指定页面分割或分割特定的页面集,并将其保存为单独的PDF文件。 PDF文档合并 支持调用API接口,将两个文档文档列表合并为一个PDF文档。 图像预处理 Document AI通过边缘检测、增强局部对比度、自动图像去偏、失真校正、模糊校正等操作对模糊、倾斜、褶皱的图片进行处理,得到清晰的图片。 PDF文档对比 提供文档对比功能,对比相似的或不同版本的PDF文档。支持对比文档中的文字、图片、线条等内容。以不同颜色展示PDF文档的编辑、删除、增加等变动。

    12.8K60编辑于 2023-03-07
  • 智能文档处理(IDP)技术深度解析

    IDP将AI/ML——自然语言处理(NLP)、计算机视觉和(半)监督/无监督学习——应用于企业文档。 在投资前,从三个轴评估您的文档环境——类型、可变性和速度。该分析将指导您选择确定性规则、适应性智能还是混合模型是最佳选择。什么是智能文档处理? 预处理:去歪斜、二值化等技术清理模糊图像。结构检测:精确分割文档,识别不同的区域(如表格、手写签名、印章),允许专门的模型处理每个区域。 容差规则:例如,接受±2%的税务偏差,自动标记>$10K的交易。第五步:路由与编排——将干净数据送达正确位置支持的工作流程:财务、保险、物流等。 IDP与其他方法的边界智能文档处理(IDP)不是OCR、RPA或自动文档处理(ADP)的替代品。相反,它充当使它们变得智能的协调者,通过做它们不能做的事情来补充它们:学习、泛化和解释超出模板的文档

    35110编辑于 2026-01-19
  • 来自专栏老雷PHP全栈开发

    jQuery基础教程之文档处理

    jQuery基础教程之文档处理 一、append appendTo append(content|fn) 向每个匹配的元素内部追加内容。

    57410发布于 2020-07-02
  • 来自专栏SpringBoot+MyBatis前端

    jQuery中的筛选&文档处理——案例

    看我怎么来写代码: $("ul>li:eq(2)").siblings().css("background","yellow"); 所有的兄弟标签 3——文档处理 增 内部插入 Append(): span").replaceWith("1234"); 替换这个地方要注意一下,替换会直接把原来的标签值给覆盖掉,所以新替换的标签内容也要手动添加上 //上述内容是jQuery中的筛选以及文档处理的一些案例介绍

    3.3K30编辑于 2022-11-18
  • 来自专栏趣谈前端

    看了10文档编辑器之后...

    作为一名技术工作者, 我们经常会遇到编写技术文档, 技术分享等需求, 网上也有很多现成的文档管理工具, 出于好奇心, 我拉着朋友一起实现了一个, 用来自给自足. 接下来就来介绍一下轻量级且灵活方便的文档编辑工具—— powerNice. powerNice 提供两种方式来编写文章/文档, 即程序员最喜欢的 markdown, 也可以使用非技术人员最容易上手的富文本编辑器. demo演示 ? 技术选型 实现 powerNice 在线文档编辑器我们采用如下核心技术栈: React Ant Design Dva For-editor Braft-editor Nodejs 浏览器指纹识别技术 功能盘点 Canvas指纹是利用系统之间, 字体渲染引擎, 抗锯齿、次像素渲染等处理方式的差异而实现的一种指纹识别技术.

    1.2K20发布于 2021-02-05
  • 来自专栏捞月亮的小北

    10. Mybatis 参数处理

    其中sql语句中的javaType,jdbcType,以及select标签中的parameterType属性,都是用来帮助mybatis进行类型确定的。不过这些配置多数是可以省略的。因为mybatis它有强大的自动类型推断机制。

    26010编辑于 2024-06-25
  • 来自专栏码客

    Windows10我的文档恢复默认

    重启电脑,定位到c:\users\你的账户\路径下,右键Documents文件夹=>属性=>自定义=>更改图标=>还原默认值=>确定。

    2.1K10编辑于 2022-01-17
  • 来自专栏喵叔's 专栏

    RavenDB 文档建模--琐碎的注意事项--处理无限增长的文档

    从这篇文章开始我将通过4到6篇文章来讲解 RavenDB 文档建模琐碎的注意事项。 处理无限增长的文档 多大的文档才能被成为大文档?多小的文档才能被称为小文档? 在 RavenDB 对文档的大小限制是有硬性规定的,不超过2GB,不要觉得着2GB不够用,RavenDB会对 JSON 文档进行压缩处理,因此如果你存储的数据大小在 2GB的话,经过 RavenDB 压缩后所占的空间会非常非常的小 这还只是一个文档的最大的大小,如果我们的业务需要几十个上百个文档呢? 虽然说 RavenDB 对存储大型文档来说有着天生的优势,但是我们也要考虑一下成本问题,首先我们通过网络读取文档时可能出现传输速度很慢的情况(文档很大),即使我们读取到了文档,因为 RavenDB 的文档都是经过压缩的 包含大小不受限制的集合: 这种原因经常出现在文档必须包含大量数据字段的情况,一般我们会采用将文档按照业务拆分为多个小文档来解决这个问题,在使用时将这些小文档再合并成一个大文档

    70010编辑于 2022-04-06
  • 来自专栏指剑的分享

    Windows批处理文件创建文本文档doc文档

    桌面右键单击 新建文本文档 修改文件后缀名 为 .bat 如下 右键编辑 输入如下内容 @echo off for /L %%x in (1,1,25) do @echo %%x>%%x.txt echo off:表示在批处理文件执行过程中,只显示结果,而不显示执行的命令; for命令: for参数 %%变量名 in (相关文件或命令) do 执行的命令; /L:迭代数值范围 (1,1,25

    1.4K10编辑于 2022-07-15
领券