00:03
哈喽,大家好,我是于小夏,这期视频我来实测一个量数据的应用场景DEMO,那么这次我选择的是一个take hunter, 然后我不讲太多的空概念,直接看他能不能真的帮我上网搜票,然后打开网页。继续找结果,然后最后把一个票务的信息整理出来返回给我啊,那么我现在打开量数记的这个demos页面。下面会进行一个实操。那么通过链接进来就是这样的一个页面。然后本期我们要用到的是这个漂浮猎手的一个代理。然后这个页面的话,集中展示的是它的一个应用场景DEMO的一个地方。然后我们现在直接点击这个。Hunter.系统演示。那我们现在已经进入了一个。一个DEMO的一个页面。
01:03
从那个页面我们的话可以发现这个DEMO的定位是很明确的,就是让agent的话实时的去网页上找票。然后他给我的不仅仅是一段搜索的一个摘要,从网络搜索到打开浏览器浏览页面,然后他会把最后一个最佳的一个门票都给我排掉,返回回来。这里的话,它是已经把这个流程是已经拆分成了四步骤。待会儿我们看到它的一个运行的一个流程。啊,我们这里的话是需要搜索的,然后你是需要什么,然后最近不是欧冠的话,四强的话已经是列出来了,那么有很多球迷的话,可能说需要在网上找欧冠球赛的票,我们来搜一下。来欧冠决赛门票进行搜索。
02:04
然后我们现在可以看到实时浏览器。这是它的第一步,然后这里我们也看到它正在运行的一个代理的一个日志API。这里通过这个页面的话,我们可以实时看到这一个进行的一个流程,这个第一步的话,它就是说它会做一个网页的一个搜索。但是他这个并不是一上来就拍脑门直接给我一个答案,他是先及时执行搜索,然后他这个的话,步骤会更接近一个真实的agent。后续的话,它会到达第二步,就是说打会打开这个浏览器。它这个打开浏览器跟普通搜索结果一个最大的区别就是它不仅仅停留在一个搜索层,而是会进入一个真实的浏览器环境进行操作,在这里我们也可以看到。这是一个网页的实时的一个页面。他会去。他跟我们就正常真人访问的话,没有任何的区别。
03:08
我们在这里等一下。第三步的话,第3步的话,它会进行一个浏览的一个页面。这一步的话是还是比较关键的,因为很多的真实网页任务并不是说拿到那个链接就直接结束了,他是需要继续进入这个站内的页面,然后找到这个具体的信息。所以他更是在。像一个真实的模拟,一个真正在执行网页的一个agent。然后这一步的话可能会比较慢,我们需要等待一会儿。
04:05
啊,从现在我们可以看到这个是页面这边的话,就显示出来一些票务的这个信息,这个最后一步的话,就是把那个最佳的门票,也就是把结果做一个排序,然后最后给我们返回回来,而不是一堆杂乱的一个链接,而是经过筛选和整理后的一个结果。啊,我们可以通过右侧的代理日志,可以试试看他的到哪一步了。我们看到现在正在提取结构化的一个数据,然后现在就是给我们返回了。
05:04
我从这里可以看到这个代理的步骤,还有A的一个行为。然后我们可以找到10张票。这大巴黎。然后我们可以点击看这个查看列表。那么它就会进入一个。开票的一个网址了。可以在这里看到一个具体的信息。那么这一类这个DEMO最重要的就是它。不止是最后有没有找到票,而是把搜索打开网页继续导航,整理结果,他的话把一整套的过程全都展现给我们了。啊,我们现在回到一个詹姆斯这个界面,最后做一个简单的一个总结,这就这次演示下来的话,我觉得take hunter这个场景的话,比较适合用来理解量数据在网页数据获取和agent的执行流程上的一个能力,它的重点不只是返回结果,而是把搜索、浏览、导航、整理结果这一套链路全都给我们呈现了出来,很直观。如果大家对这类能力感兴趣,我建议直接去量数据的官网把相关DEMO码亲自体验一下,只有自己输入查询,自己观察执行过程才能够更直观的。
06:29
感受到这类方案跟传统搜索工具之间的一个差异,同时这类网页数据抓取与整理能力在商业的场景中也有比较明显的应用价值。以这次的一个take hunter为例的话。它对应的其实是一个票务的一个整合。票务的一个聚合,然后价格监控,然后信息整合,这一类的一个需求,如果放大到一个更大的一个企业的场景里,它就像一个OTA的一个平台,接入携程这类业务也会涉及大量实时信息的一个采集,然后结果整合和展示,所以这类能力是有实际应用空间的,这也是我认为他值得关注的一个地方。
07:12
啊,那么本期视频以上内容就是这些,谢谢大家观看。
我来说两句