首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏我的机器学习之路

    Python处理Excel文档

    这里用到一个名为xlrd的库,我用来筛选教师编制考试的信息,表格实在太大了,用Excel标注完了删除都要删半天,为此特地学了一下午:

    67410发布于 2020-10-23
  • 来自专栏码生

    图片处理(收集文档

    通过Core Library的文档,我们知道创建颜色有这么几个方法: CGColorCreate CGColorCreateCopy CGColorCreateGenericGray CGColorCreateGenericRGB

    1.7K30发布于 2018-11-21
  • 来自专栏海天一树

    LDA处理文档主题分布

    这篇文章主要是讲述如何通过LDA处理文本内容TXT,并计算其文档主题分布。 在了解本篇内容之前,推荐先阅读相关的基础知识: LDA文档主题生成模型入门 结巴中文分词介绍 爬取百度百科5A景点摘要并实现分词 使用scikit-learn计算文本TF-IDF值 一、完整程序 from 1 (4, 6) 1 (5, 7) 1 (5, 5) 1 (5, 3) 1 (5, 6) 1 (0, 5) 1 表示第5个词“新年”在第0行里出现了1次。 (0, 3) 1 表示第3个词“年货”在第0行里出现了1次。 哪个概率大说明这个文档的主题是哪个。 最终10篇文章分别对应于主题1, 1, 0, 0, 1, 1, 0, 0, 1, 0。 ? doc_topic.png 这里列出了其中6个文档的主题分布图。

    1.8K30发布于 2018-07-25
  • 来自专栏九陌斋

    文档处理与查询设计

    1.1 分词 实现思路 针对文档文档进行分词,利用python中的jieba库可以很轻松的实现。即首先将文档提取到一个文件内,然后遍历处理即可。 ', 'd5'] 四、请建立上述文档集合的词频矩阵。 框架图 功能说明 文档处理(语言及其他处理) 包括文档格式处理文档语言识别、文档编码识别,即在文本分类索引之前,先对文档进行预处理。 如果结果 < k 篇文档,那么从下一层继续处理,直至索引用完或者返回至少k 个结果为止。 查询处理 给定查询 Q, 找离它最近的先导者L,从L及其追随者集合中找到前K个与Q最接近的文档返回。

    99950编辑于 2022-12-26
  • 来自专栏逻辑熊猫带你玩Python

    使用Python处理Word文档

    使用Python处理Word文档 1. 前言2. 使用Document对象创建文档3. 在word文档中使用标题4. 在word文档中使用段落5. 在word文档中使用列表6. python-docx-{version} python setup.py install 另外附上一个下载链接: https://files.pythonhosted.org/packages/4a/8e/5a01644697b03016de339ef444cfff28367f92984dc74eddaab1ed60eada , level=3) document.add_heading(text=u'这是四级标题', level=4) document.add_heading(text=u'这是五级标题', level=5) 5. 在word文档中使用列表 列表分为有序列表和无序列表,还有使用特殊样式的列表,在这里仅讲述如何使用有序列表和无序列表。 实际在Document()对象中列表是段落的一种样式。 document.add_paragraph('这是第一页') document.add_page_break() document.add_paragraph('这是第二页') document.save("5-

    8.1K43发布于 2019-09-03
  • 来自专栏史上最简单的Spring Cloud教程

    docker官方文档翻译5

    在第5部分中,你将学习分布式应用程序层次结构的顶部:堆栈。 堆栈是一组相互关联的服务,它们可以共享依赖关系,并且可以进行协调和伸缩。 /repo:tag with your name and image details image: username/repo:tag deploy: replicas: 5 ) Creating service getstartedlab_visualizer (id: l9mnwkeq2jiononb5ihz9u7a4) 查看可视化界面 你在Compose文件中看到,可视化工具在端口 转到8080端口的IP地址,您可以看到可视化器正在运行: 可视化器的单个副本按照预期在manager上运行,并且网络的5个实例遍布整个群集。 /repo:tag with your name and image details image: username/repo:tag deploy: replicas: 5

    51210编辑于 2022-05-07
  • 来自专栏自动化、性能测试

    MongoDB(5)- Document 文档相关

    Documents MongoDB 的文档可以理解为关系型数据库(Mysql)的一行记录 MongoDB 将数据记录为 BSON 格式的文档 BSON 是 JSON 文档的二进制表示,但它支持的数据类型更加丰富 ,需要查看 driver 驱动相关的文档(后续介绍) 一些由内部 MongoDB 进程创建的文档可能有重复的字段,但是没有 MongoDB 进程会将重复的字段添加到现有的用户文档中 访问文档 跟访问 python 更多查询数组字段的方法后面展开详解 访问文档里面的嵌套文档 "<embedded document>.<field>" 嵌套文档小栗子 { ... 更多嵌套查询的方法后面展开详解 字段值的限制 对索引字段的最大长度有限制(后面更新文章再更新这里) 文档的限制 文档大小限制 最大 BSON 文档大小为 16 mb 最大文档大小有助于确保单个文档不能使用过多的内存 BSON BinData类型的值 如果满足以下条件,则 BinData 类型的索引键将更有效地存储在索引中: 二进制子类型值在0-7或128-135之间,并且 字节数组的长度为:0、1、2、3、4、5

    1.8K20发布于 2021-06-01
  • 来自专栏Python编程 pyqt matplotlib

    PyQt5 文档打印

    本篇通过Python3+PyQt5实现《python Qt Gui 快速编程》这本书13章文档打印功能。 本文共通过三种方式: 1,使用HTML和QTextDOcument打印文档,最简单 2,使用QTextCusor和QTextDocument打印文档 3,使用QPainter打印文档 使用Qpainter 打印文档比QTextDocument需要更复杂的计算,但是QPainter确实能够对输出赋予完全控制。 import math import sys import html from PyQt5.QtPrintSupport import QPrinter,QPrintDialog from PyQt5. QtPrintSupport import QPrinter,QPrintDialog from PyQt5.QtCore import (QDate, QRectF, Qt) from PyQt5.QtWidgets

    1.6K40发布于 2019-08-14
  • 来自专栏IT云清

    5.Elasticsearch检索文档

    前一篇我们索引(存储)了文档,本篇我们讲解最简单的查询文档,和删除文档。 1.根据id查询文档 我们执行一个http get请求,指定文档的索引库,类型,id,即可返回此文档 GET people/user/1 返回结果为: { "_index": "people", interests": [ "bastkeyball", "football" ], "create_time": "2018-02-04" } } 我们会发现,我们存储的文档 2.删除文档 DELETE people/user/1 返回结果为: { "found": true, "_index": "people", "_type": "user", "_id deleted", "_shards": { "total": 2, "successful": 1, "failed": 0 } } 当我们再次查询时,会发现找不到这个文档

    60420发布于 2019-01-22
  • 来自专栏Linux技术资源分享

    Python处理Excel文档之openpyxl

    ****openpyxl简介**** 还是简单一句:顾名思义,openpyxl就是一个处理excel文档的一个python库。 path) # 也可以将文件作为模板保存 as_template默认为False wb.save('document_template.xltx', as_template=True) 简单的样式处理

    1.4K40发布于 2018-06-08
  • 来自专栏机器学习AI算法工程

    图像处理文档矫正DocTr++

    、介绍 Doctr++除了提出一种新的architecture外,most importantly,提出了一种新的数据处理方式,解决了以前文档矫正只能处理带有边界信息的完整文档,文章通过数据处理定义了三种类型的训练数据 图1展示了三类常见的形变文档图像:(a) 包含完整文档边界,(b) 包含部分文档边界,(c ) 不包含文档边界。 **实验发现,每一个矫正提示向量会关注输入形变文档图像中的某一特定区域,这些区域组合起来便覆盖整张输入图像。 三、评价指标 论文提出了两种新的评价指标 MSSIM-M 和 LD-M,用于通用形变文档图像矫正质量的评估。 为了实现优秀的矫正效果,DocTr++采用了一种多尺度编解码器结构,构建各类形变文档图像与无形变文档图像之间的逐像素映射关系。

    98210编辑于 2024-06-08
  • 来自专栏毛利学Python

    图像和办公文档处理

    图像和办公文档处理 用程序来处理图像和办公文档经常出现在实际开发中,Python的标准库中虽然没有直接支持这些操作的模块,但我们可以通过Python生态圈中的第三方模块来完成这些操作。 用Pillow操作图像 Pillow是由从著名的Python图像处理库PIL发展出来的一个分支,通过Pillow可以实现图像压缩和图像处理等各种操作。可以使用下面的命令来安装Pillow。 pip install pillow Pillow中最为重要的是Image类,读取和处理图像都要通过这个类来完成。 Word文档 利用python-docx模块,Python可以创建和修改Word文档,当然这里的Word文档不仅仅是指通过微软的Office软件创建的扩展名为docx的文档,LibreOffice Writer 和OpenOffice Writer都是免费的字处理软件。

    69030编辑于 2022-08-18
  • 来自专栏Super 前端

    HTML5-创建HTML文档

    下述内容主要讲述了《HTML5权威指南》第7章关于“创建HTML文档”。 HTML5中的一个主要变化是:将元素的语义与元素对其内容呈现结果的影响分开。从原理上讲这合乎情理。 其告知浏览器两件事情:第一,它处理的是HTML文档;第二,用来标记文档内容的HTML所属的版本。 注意,在HTML4中要求的DTD已不再HTML5中使用! 提供了5个预定义的元数据名称。 三、使用脚本元素 与脚本相关的有两个元素:第一个是script,定义脚本并控制其执行过程;第二个是noscript,规定浏览器不支持脚本或禁用脚本情况的处理方法。 其加载资源时,可以使用async(script元素默认行为是在加载和执行脚本同时暂停处理页面,该属性可以让资源异步加载)和defer(告知浏览器等页面载入和解析完毕后才能执行脚本)控制。

    1.8K30发布于 2021-08-30
  • 来自专栏Super 前端

    HTML5-创建HTML文档

    下述内容主要讲述了《HTML5权威指南》第7章关于“创建HTML文档”。 HTML5中的一个主要变化是:将元素的语义与元素对其内容呈现结果的影响分开。从原理上讲这合乎情理。 其告知浏览器两件事情:第一,它处理的是HTML文档;第二,用来标记文档内容的HTML所属的版本。 注意,在HTML4中要求的DTD已不再HTML5中使用! -- 5s后刷新当前页面 --> <meta http-equiv="refresh" content="<em>5</em>"> <! 三、使用脚本元素 与脚本相关的有两个元素:第一个是script,定义脚本并控制其执行过程;第二个是noscript,规定浏览器不支持脚本或禁用脚本情况的处理方法。 其加载资源时,可以使用async(script元素默认行为是在加载和执行脚本同时暂停处理页面,该属性可以让资源异步加载)和defer(告知浏览器等页面载入和解析完毕后才能执行脚本)控制。

    2.3K51发布于 2019-08-15
  • 来自专栏LNMP开发那些事

    概览 - 构建文档 - ckeditor5中文文档

    概览 ckeditor 5构建版本是一些被准备好的富文本编辑器的集合。每一个“构建版本”提供一个包含一系列特性和一个默认配置的编辑器。 Document 编辑器 Document编辑器专注于富文本编辑体验类似于word处理器。它适用于创建用于打印或者导出为PDF文件的文档。 ? 在线试用,请点击document编辑器示例。 下面是一些公共用例: 在内容管理系统中: 写文章或者网站内容的表单 在线编辑页面前端样式 评论 在商场和自动销售应用中: 发送一个邮件活动 创建模板 在论坛应用中: 创建主题和回复 在团队合作应用中: 创建共享文档 ckeditor5替换它的时候 下面的用例,你应该使用消息: 当你需要一个简单的方式在你的应用中实现创建满足以下特性的文章和文档: 实时共享书写 在线评论和讨论内容 高级书写特性 文章作者ianzhi, 原文地址:https://www.dnote.cn/users/ianzhi/posts/ckeditor5-builds-overview 文章版权归作者所有,转载请保留此声明。

    9.3K30发布于 2019-07-31
  • 来自专栏站长的编程笔记

    rust语言处理含有中文内容文档处理方法

    在Rust中处理包含中文内容的文本文件时,确保正确处理文件的编码非常重要。通常情况下,中文文本文件使用UTF-8编码,但有时也可能使用其他编码,比如GBK。 在Rust中,你可以使用第三方库encoding来处理不同的文本编码。 以下是一个简单的例子,展示了如何读取包含中文内容的文本文件并处理不同的编码: 首先,将 encoding 添加到你的 Cargo.toml 文件中: [dependencies] encoding =  ("Failed to decode the file content");         }     }     Ok(()) } 实际上你可能需要根据具体情况进行更复杂的处理

    1.1K10编辑于 2023-12-23
  • 来自专栏ComPDFKit tutorials

    ComPDFKit - 专业的PDF文档处理SDK

    标记密文 对图像、文本和矢量图形中的敏感信息或隐私数据进行不可逆的密文处理,阻止了他人访问敏感信息。同时支持多种方式标记密文。 PDF文档对比 提供文档对比功能,对比相似的或不同版本的PDF文档。支持对比文档中的文字、图片、线条等内容。以不同颜色展示PDF文档的编辑、删除、增加等变动。 图像预处理 Document AI通过边缘检测、增强局部对比度、自动图像去偏、失真校正、模糊校正等操作对模糊、倾斜、褶皱的图片进行处理,得到清晰的图片。 5.Web Viewer PDF To / From Word 提供API接口,帮助您的APP实现PDF文件和Word文件格式互转:PDF转Word、Word转PDF格式。 PDF文档对比 提供文档对比功能,对比相似的或不同版本的PDF文档。支持对比文档中的文字、图片、线条等内容。以不同颜色展示PDF文档的编辑、删除、增加等变动。

    12.8K60编辑于 2023-03-07
  • 智能文档处理(IDP)技术深度解析

    IDP将AI/ML——自然语言处理(NLP)、计算机视觉和(半)监督/无监督学习——应用于企业文档。 在投资前,从三个轴评估您的文档环境——类型、可变性和速度。该分析将指导您选择确定性规则、适应性智能还是混合模型是最佳选择。什么是智能文档处理? 预处理:去歪斜、二值化等技术清理模糊图像。结构检测:精确分割文档,识别不同的区域(如表格、手写签名、印章),允许专门的模型处理每个区域。 IDP与其他方法的边界智能文档处理(IDP)不是OCR、RPA或自动文档处理(ADP)的替代品。相反,它充当使它们变得智能的协调者,通过做它们不能做的事情来补充它们:学习、泛化和解释超出模板的文档。 成功意味着更高的F1/首次通过率、更低的异常率和单文档成本,以及稳定的可审计性。5. IDP能可靠地处理手写内容吗?我们应该有什么期望?

    35110编辑于 2026-01-19
  • 来自专栏老雷PHP全栈开发

    jQuery基础教程之文档处理

    jQuery基础教程之文档处理 一、append appendTo append(content|fn) 向每个匹配的元素内部追加内容。

    57410发布于 2020-07-02
  • 来自专栏LNMP开发那些事

    快速开始 - 构建文档 - ckeditor5中文文档

    使用CKEditor5构建来创建一个编辑器时非常简单的,可以分两个步骤来描述: 使用<script>标签加载所需的编辑器。 调用create()方法来创建编辑器。 还有其他安装和集成方法可供使用。 id="editor"></textarea> 加载classic编辑器构建版本(这里使用的CDN): <script src="https://cdn.ckeditor.com/ckeditor<em>5</em>/ DOCTYPE html> <html lang="en"> <head>     <meta charset="utf-8">     <title>CKEditor 5 – Classic editor </title>     <script src="https://cdn.ckeditor.com/ckeditor<em>5</em>/11.1.1/classic/ckeditor.js"></script> </ DOCTYPE html> <html lang="en"> <head>     <meta charset="utf-8">     <title>CKEditor 5 - Inline editor

    7.7K20发布于 2019-07-31
领券