首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏程序员分享

    Flutter 语音礼物下载方案(完整版)

    Flutter 语音礼物下载方案(完整版) 场景:语音礼物资源下载,文件类型为 mp4(~10MB)和 webp(~1MB) 核心能力:网络自适应 · 多文件并行 · 单文件分片 · 断点续传 · (运营商劫持)低(HTTPS 加密)解析精度运营商粒度可精确到客户端 IP缓存控制运营商控制 TTL客户端可控Flutter 方案系统默认阿里云/腾讯云 HTTPDNS SDK在礼物下载中的应用:进入语音时 IP + Host 头,跳过系统 DNS缓存多个 IP,主 IP 不通时自动切换备用 IP10.2.3 DNS 预解析javascript 体验AI代码助手 代码解读复制代码时机:App 启动 / 进入语音预解析域名列表 请求 → 省去 200-500ms10.8.2 HTTP/2 连接预热HTTP/2 下只需要预热一条连接,后续所有分片都复用这条连接: 体验AI代码助手 代码解读复制代码预热时机: ├── 进入语音时 + 的内存波动 └── 语音本身已有音频缓冲区和 UI 渲染开销,这很危险10.9.2 大文件合并的内存控制scss 体验AI代码助手 代码解读复制代码错误做法: chunk0_bytes = File

    10810编辑于 2026-03-21
  • 来自专栏用户9880750的专栏

    狸猫语音PK 系统开发现成案例原生开发源代码

    语音系统的开发涉及多个技术领域,包括音频处理、实时通信、用户界面设计、数据存储等。 为了帮助你更好地理解开发流程和所需的技术组件,以下是一个语音系统开发的简要框架:前端(HTML + JavaScript)<!

    38320编辑于 2024-12-05
  • 来自专栏小鹏的专栏

    10 端到端语音识别

    端到端语音识别 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? • Espnet: https://github.com/espnet/espnet • 实现了主流的端到端语音识别方法 • Speech-Transformer、LAS、CTC、RNN-T • 一个小缺点

    1.9K20发布于 2020-03-25
  • 来自专栏子舒的个人博客

    随想录 (10) --- 我是否陷入了信息茧

    如题,我是否陷入了信息茧?暂时是以一个疑问句的形式出现,因为我还未确认事实真的如此。 什么是信息茧? 信息茧是一种现代的网络语境下的概念,指的是某些人因过度沉溺于网络而逐渐隔离于现实世界,形成了一种"信息茧",难以自拔。 直接今年2月中旬它再一次出现在我的眼前,以一个强大的姿态席卷而来,在短短两个月的时间收获了全球10亿用户,而这个数量也正在以指数增长。我想这和微软的投资有着很大关系,再一次证明了其眼光的卓越性。 十条帖子有一半是关于 chatGPT 的,感觉自己的信息通道快被占满了,这让我很烦躁,我开始质问自己是否陷入了信息茧。 我仔细研究了一下,被"信息茧"的人通常具有以下几个特点: ---- 偏见和偏激:他们往往只信任那些与他们观点相同的信息,不愿接受不同的观点和证据。

    23420编辑于 2023-08-23
  • 来自专栏Reinvent Data Science

    AI 搜,贝壳找的Milvus实践

    我们都知道计算机没有办法处理图片、语音、人类语言等非结构化数据,借助人工智能“万物皆可 embedding",通过 embedding 技术将这些非结构化数据映射成多维向量,再使用向量搜索工具就可以轻松地分析数据 | 引入Milvus Milvus 向量相似度搜索引擎可以对接包括图像处理、机器视觉、自然语言处理、语音识别、推荐系统以及新药发现等 AI 模型,为向量化后的非结构数据提供搜索分析服务。 房源搜索的应用场景中,我们首先将房源信息按照不同因素(比如有关型布局、面积分布、外轮廓等)采用机器学习模型生成不同维度的特征向量,每一套房子都会对应一组特征向量,然后根据不同的特征向量在 Milvus 中进行相似性搜索,这里每一组向量搜索的结果都是从不同角度来分析相似型,最后综合多个向量搜索的结果最终为用户提供推荐的房源类型。 | 更多场景的应用 作为贝壳搜索平台,向量搜索业务肯定不止房源相似性分析,未来还需要对图片、视频、语音、文本等一系列非结构化数据的特征向量做分析,通过将各种各样的数据结合 Milvus 向量搜索引擎做分析

    1.5K20发布于 2020-04-28
  • 来自专栏软件安装

    10个GitHub热门的配音语音合成语音克隆项目

    这里推荐几个GitHub上热门、好用的配音/语音合成/语音克隆项目,有通用TTS、语音克隆、视频配音、流式/轻量等不同需求的。 ▌1. Real-Time-Voice-Cloning(⭐ 52k+) 地址:https://github.com/CorentinJ/Real-Time-Voice-Cloning 功能: 经典实时语音克隆框架 Fish Speech(⭐ 10k+) 地址:https://github.com/fishaudio/fish-speech 功能: 基于VITS2,高质量、多语言、语音克隆 推理快、支持批量处理、全开源 ▌10. VoxCPM(OpenBMB,⭐ 2k+) 地址:https://github.com/OpenBMB/VoxCPM 功能: 无分词器TTS,直接在连续语音空间建模 上下文感知、零样本克隆、自然度高

    77810编辑于 2026-03-26
  • 来自专栏一“技”之长

    iOS10语音识别框架SpeechFramework应用

    iOS10语音识别框架SpeechFramework应用 一、引言         iOS10系统是一个较有突破性的系统,其在Message,Notification等方面都开放了很多实用性的开发接口 本篇博客将主要探讨iOS10中新引入的SpeechFramework框架。 有个这个框架,开发者可以十分容易的为自己的App添加语音识别功能,不需要再依赖于其他第三方的语音识别服务,并且,Apple的Siri应用的强大也证明了Apple的语音服务是足够强大的,不通过第三方,也大大增强了用户的安全性 SFSpeechRecognizer:这个类是语音识别的操作类,用于语音识别用户权限的申请,语言环境的设置,语音模式的设置以及向Apple服务发送语音识别的请求。 三、申请用户语音识别权限与进行语音识别请求         开发者若要在自己的App中使用语音识别功能,需要获取用户的同意。

    1.4K20发布于 2018-08-15
  • 来自专栏企服杂谈

    10亿美金入股贝壳找,软银接盘还是赌未来

    按照软银实际出价,贝壳找D+轮估值已经达到140亿美金,折合成人民币已然千亿大佬。作为房地产中介平台,这个价格堪称前无古人。 贝壳估值最好对标对象,现在来看有两个,一个是曾经的互联网房地产平台头牌天下,另一个则是同为房产中介且在A股上市的我爱我家。 而贝壳找+线下中介业务天地两网的搭建,似乎也没想象中走的那么顺利。 1、贝壳的互联网平台并未建立真正优势 贝壳找上线后多为业内诟病,言必称贝壳假托平台,其实是一边做裁判员一边当运动员。 事实上,链家之强,已经不在二手。这几年房地产开发商日子不好过,贝壳携链家之实已经悄然杀入。 整个政策环境,也已经明确“住不炒”的大国基调。纵然体量仍然庞大,但中国房地产市场要再复辉煌,恐怕已经是黄粱一梦。

    66600发布于 2020-03-17
  • 来自专栏喔家ArchiSelf

    “他山之石”,语音技能开发的10个要点

    “他山之石,可以攻玉”,本文编译自Amazon Alexa 的“10 Things Every Skill Should Do”,尽管是两年前的文字,还是有一定的参考意义的。 语音技能的构建既是一门艺术,也是一门科学。开发智能语音技能有一些技术方面因素,还要有设计语音体验的创意,两者都很重要。 那么,在开发智能语音技能的时候有哪些共同的要点呢? ? 1. 聚焦并做好一个功能 在开始设计语音技能时,开发者可能会希望这个技能可以非常熟练地处理各种请求。但是,对于使用语音交互的用户而言,记住所有不同的选择是很困难的。 10. 充分测试 智能语音技能同样是一种软件服务,充分测试的重要性毋庸置疑。 调试对于创作出深受用户喜爱的语音技能意义重大,目前,DuerOS提供了意图调试、模拟器调试、真机调试、团队真机调试以及日志追踪调试等多种方式,详情可以参考《调试DuerOS的智能语音技能》一文。

    72031发布于 2020-10-30
  • 来自专栏算法工程师的学习日志

    10行内Python代码实现语音识别

    最近在做一个语音识别的项目,故分享一下相关内容 Python在语音识别方面功能很强大,程序语言简单高效,下面编程实现一下如何实现语音识别。本文分享如何调用百度AI开放平台实现语音识别技术。 创建应用完成后,进入管理页面,可以看到应用对应的 “AppID”、“API Key”与“Secret Key”,这些信息在调用语音识别需要提供。 创建了应用,我们便可以调用接口实现语音识别了。 get_file_content(filePath): with open(filePath, 'rb') as audio: return audio.read() 接下来,便是惊心动魄的语音识别过程了 get_file_content('test.wav'), 'wav', 16000, {'dev_pid': 1536, }) print(res['result'][0]) 在这里,我们提前录制了一个语音文件 client.asr(get_file_content('test.wav'), 'wav', 16000, {'dev_pid': 1536, }) 这一行代码实现了具体的语音识别过程,其中,get_file_content

    1.7K20编辑于 2022-07-27
  • 来自专栏游戏多媒体引擎GME开发前沿

    GME SDK 2.9.3,Xbox平台适配3D语音优化内存消耗优化进耗时优化

    3、新增 3D 语音黑名单接口 在一些应用场景下,不希望某个玩家角色声音会有 3D 空间语音效果,如「主持人」角色。 6、减少实时语音功能进耗时 优化 SDK 内部进流程,麦克风、扬声器等设备启动时间缩短。 旧版本如何升级? 关注公众号,回复「加群」 加入 GME 游戏语音开发者交流群, 咨询 SDK 接入问题。 ‍ 针对游戏场景,提供实时语音语音消息、语音转文本、语音内容安全、语音录制、未成年人识别、正版曲库等服务,一次接入即可满足多样化的语音需求。 GME 已服务于 6000+ 海内外游戏厂商及开发者,每天提供超过 10 亿分钟的稳定语音服务。 点击“阅读原文”直达 SDK 下载页

    80920编辑于 2022-08-16
  • 来自专栏VRPinea

    VR看,虽能拓客,却难救

    VR看无疑是这轮“云看”热潮中的佼佼者,VRPinea作为一家专注于VR的TMT媒体,梳理了市场中常见的VR看手段。来分析一下,VR看的优势到底几何。 VR看三板斧,哪种方式更有机会? 这种方式如贝壳找的“如视团队”正在使用。 ? 第三类为基于纯粹的户型结构来进行3D建模,从而获得更早的预售时间和看方式。 当然,在这些VR看中,各类技术方案各有各的优势,针对期房、现房、二手、毛坯不同的房屋情况采用最合理的方案,也是各家VR看目前所需要思考的现状。 VR看虽便捷, 但最后收益如何尚需时间 无论是云看,还是直播卖房,目前VR看都是其中的重要展现手段。但短期内尚无法开放的房地产交易,始终是企目前难以跨过去的坎。 在不会重复2008年4万亿规模的放水的前提之下,让企平稳的渡过危机,也就成为这段时间热议的话题。 VRPinea相信在疫情之后,VR看也会逐步成为企、房产中介的必备展示手段。

    84810发布于 2020-03-05
  • 来自专栏小明的博客

    天下二手交易数据爬取

    本次是爬取西安天下上的二手交易数据,主要面临的困难有: 网页的重定向问题的识别 不完全规则网页的匹配规则书写问题 爬虫效率问题 滑块验证问题 import requests from scrapy.selector data).xpath( '//div[@class="rcont"]/a/text()').extract_first() # 小区位置具体描述 x10 /h4/text()').extract_first() datas.append([x1, x2, x3, x4, x5, x6, x7, x27, x8, x9, x10, x11, 另外就是需要注意的是这里拿到的url并非链接地址栏显示的url,据我观察链接地址栏的url会在一段时间后失效,具体的机理分析仍有待进一步的深入学习 终稿 经过一番重塑修改,对代码的逻辑进行进一步优化,最后写出了最终版本的天下二手交易数据爬取 text=data).xpath( '//div[@class="rcont"]/a/text()').extract_first() # 区 x10

    1.1K10编辑于 2022-09-06
  • 来自专栏yuyy.info技术专栏

    打破信息茧

    “信息茧”这一概念,最初是在桑斯坦的《信息乌托邦——众人如何生产知识》一书中提出的,意指在信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的和使自己愉悦的领域,久而久之,会将自身像蚕茧一般桎梏于 “茧”中。    信息茧既包括算法推荐造成的茧,也包括用户的自身选择将自我陷入茧之中。

    67930编辑于 2022-09-21
  • 来自专栏Rindew的iOS技术分享

    iOS地图找(类似链家、安居客等地图找)

    题外话:在百度搜索键入:iOS地图找。你会发现搜索到很多关于这方面的帖子,但是几乎都是询问如何实现的,找不到一个可以研究借鉴的博客。于是我决定补上这个空缺,写的可能不全面,大家体谅。 ; self.mapView.showMapScaleBar = YES;//显示比例尺 self.mapView.mapScaleBarPosition = CGPointMake(10 self.contentView.titleEdgeInsets = UIEdgeInsetsMake(-5, 0, 0, 0); self.contentView.titleLabel.font = font(10

    1.9K60发布于 2018-06-14
  • 来自专栏架构精进之路

    “信息茧”里的人

    信息茧(Information Cocoons) “ 指人们的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧”中的现象。 其解释说,生活在“信息茧”里,公众就不可能考虑周全,因为他们自身的先人之见将逐渐根深蒂固。对于生活在信息茧的人而言,这是一个温暖、友好的地方。但是,重大的错误就是舒适的代价。

    64921发布于 2020-08-17
  • 来自专栏Lan小站

    JS逆向之天下

    这是天下的登陆地址:链接地址 打开检查,刷新页面 随便输入,进行测试 密码已加密,搜索pwd 结果很多,慢慢看 疑似这个,打断点查看一下 搜索第一个值key_to_encode 然后得到这一长串东西

    78520编辑于 2022-07-14
  • 来自专栏个人随笔

    上的猫:JavaDoc注释

    //这是一个注释 /*   *这是一个演示程序   */ /**    *@这是JavaDoc注释。   */ JavaDoc注释    背景:       javadoc是Sun公司提供的一个技术,它从程序源代码中抽取类、方法、成员等注释形成一个和源代码配套的API帮助文档。也就是说,只要在编写程序时以一套特定的标签作注释,在程序编写完成后,通过Javadoc就可以同时形成程序的开发文档了。   语法规则:      (1)JavaDoc注释以"/**"开头,以"*/"结尾      (2)每个注释包含一

    1.3K100发布于 2018-03-14
  • 来自专栏个人随笔

    上的猫:数组

    一.数组:  1.定义:   (1)数组就是一个变量,用于将相同数据类型的数据储存在内存中   (2)数组中的每一个数据元素都属于统一数据类型  2.基本要素:   (1)标识符:    和变量一样,在计算机中,数组也要有一个名称,称为标识符,用于区分不同的数组   (2)数组元素:    当给出数组名称,即数组标识符后,要向数组中存放数据,这些数据就称为数组元素   (3)数组下标:    在数组中为了正确地得到数组的元素,需要对它们进行编号,这样计算机才能去存取,这个编号就称为数组下标   (4)元素类

    1.2K90发布于 2018-03-14
  • 来自专栏即时通信IM

    恭喜贝壳找上市!

    北京时间8月13日晚间,中国领先的线上线下房产交易和服务平台——贝壳找正式在纽交所挂牌上市,证券代码为“BEKE”。 ? 但正是这个历时10年搭建的“楼盘字典”,率先在房地产行业内制定了真房源标准,奠定了居住服务行业的基础。 2014年,链家开始全面布局互联网,链家网上线,房地产交易的数字化迈出重要一步。 团队并没有停下,如何让消费者能在线上身临其境地“看”成为新命题,VR成为一个解决方案。2018年,贝壳开始推动VR看落地。 从1月27日项目启动,到2月9日第一版上线,一共只用了10天时间。 ? 产品上线第二天,贝壳平台上的经纪人就开始了置业服务。 北京团结湖片区的链家经纪人小梁在疫情期间用VR带看的产品接待了10多位个客户:“这种线上看的方式让大家都少跑了很多路,不符合自己需求的型一下子就可以排除掉,效率提升很多。

    1.2K40发布于 2020-08-17
领券