搜狗中的垂直搜索可以搜索微信公众号吗
搜狗中的垂直搜索可以搜索微信公众号。
垂直搜索引擎提供搜索服务 垂直搜索引擎提供搜索服务是什么
垂直搜索引擎提供搜索服务 垂直搜索引擎提供搜索服务是什么
搜狗是一家知名的搜索引擎,提供多种搜索服务,包括网页搜索、搜索、视频搜索、音乐搜索等。其中,搜狗的垂直搜索是指针对某一特定领域的搜索服务,例如微信公众号搜索、知乎问答搜索、贴吧搜索等。
在搜狗中搜索微信公众号,用户可以输入相关的,搜狗会返回与该相关的微信公众号信息,包括公众号名称、、文章等。
垂直搜索引擎有哪些
有MP3搜索、搜索、搜索、BLog搜索等等。的垂直搜索引擎还有:旅游类的搜索引擎(比如携程旅行网等)、商业类的搜索引擎、比价类的搜索引擎都是垂直搜索引擎等等。
国内有哪些垂直搜索引擎
国内垂直搜索引擎如下:
1、搜狗,搜狐公司的旗下子公司,搜狗的名称取自2001年电影《大腕》里的幽默台词他们搜狐,我们搜狗,各搜各的。于2004年8月3日推出,目的是增强搜狐网的搜索技能,主要经营搜狐公司的搜索业务。在搜索业务的同时,也推出搜狗输入法、搜狗高速浏览器。
2、百度,全球的中文搜索引擎及的中文网站,全球领先的人工智能公司。百度二字,来自于八百年前南宋词人辛弃疾的一句词,众里寻他千百度。这句话描述了词人对理想的执着追求百度是懂用户,并能帮助人们成长的全球高科技公司。
3、搜搜,腾讯旗下的搜索网站,是腾讯主要的业务单元之一,网站于2006年3月正式发布并开始运营。搜搜目前已成为网民的三大搜索引擎之一,主要为网民提供实用便捷的搜索服务,同时承担腾讯全部搜索业务,是腾讯整体在线生活战略中重要的组成部分之一。
4、360,一个全面的元搜索引擎搜索,是一种搜索引擎。是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的,搜索引擎来实现检索作,是分布于网络的多种检索工具的全局控制机制。
5、有道,旗下的子公司,利用大数据技术提供移动互联网应用。有道业务广泛,有道公司先后推出有道词典、有道云笔记、慧慧网、有道推广等系列产品。有道以搜索产品和技术为起点,在大规模数据存储计算等领域具有深厚的技术积累,并在此基础上衍生出语言翻译应用与服务、个人云应用和电子商务导购服务等三个核心业务方向。
[基于垂直搜索引擎的旅游线路评价模型的设计] 有哪些垂直搜索引擎
科技创新导报2010 NO.18
Technology Innovation Herald
技术创新
基于垂直搜索引擎的旅游线路评价模型的设计
陈高维1 邓天权1,2 曾云磊1 王维国3 张龙1
(1.电子科技大学 四川成都 611731; 2.常州大学 江苏常州 213164; 3.成都登巅科技有限公司 四川成都 610041)摘 要:本文设计了一个基于垂直搜索引擎技术的旅游线路评价模型系统。该系统首先采用垂直搜索引擎技术针对旅业网站抓取特定信息,提取旅游路线及相关旅游资讯信息,并辅以人工资讯录入方式,建立旅游路线、旅游资讯数据库。:垂直搜索引擎 信息提取 旅游线路评价模型中图分类号:TP3文献标识码:A文章编号:1674-098X(2010)06(c)-0024-02
1 引言
随着互联网的普及,人们越来越习惯于在出门旅游之前通过互联网了解一些旅游相关的资讯。但是,在浩如烟海的互联网上人们想要获取特定的旅游资讯并不是一件容易的事情。为了满足越来越多游客的旅游资讯搜索需求,帮助游客轻松获取旅游路线信息和旅途上的各类资讯。本课题研究了基于垂直搜索引擎的旅游线路评价系统,为游客提供旅游线路的搜索服务,路线,提供旅游路线上相关旅游资讯。
2 垂直搜索引擎
垂直
搜索引擎实现的流程大致如下:spider抓取网页后,对网页中信息进行抽取,然后对上述非结构化数据进行清洗、去重、分类、分析比较、数据挖掘,抽取出结构化的数据储存到数据库中,后通过中文分词建立索引提供用户搜索。其关键技术有:
(1)面向主题的高效蜘蛛程序
主题蜘蛛程序[2]是垂直搜索引擎的重
要组成部分。其抓取范围一般只限于特定的主题或专门的领域。主题蜘蛛的设计通常需要解决好主题相关度的预测、种子站点的选择方案、URL的搜索策略等问题。
(2)网页信息的格式化提取
信息抽取(rmation Exaction,IE)[3]一般定义为从一段文本中抽取指定的预先想要的信息(、事实),表示为结构化的、统一的形式,供信息查询、文本深层挖掘,问答系统、抽样统计等应用.目前比较比较常
[4]
用的方法有:①基于特征模式匹配的信息抽取。②基于归纳学习的信息抽取。③基于网页结构特征分析的信息抽取。④基于on-tology的Web信息抽取。前3几种信息抽取的方法虽各有其特点,但技术上主要是通过为待提取的目标建立相应的模板库,并将文档内容与模板库中的模板匹配而实现提取。模板的表达能力直接影响系统的准确度。第四种方法引入本体(Ontology)的概念较好的解决了词序、多义等问题,本体论从语义信息入手进行抽取。但是对特定领域本体构建是一件非常困难的事情。
3 旅游线路系统的设计与实现
3.1系统的主要功能
为了给游客提供高质量、个性化的旅游资讯服务。本文在旅游信息的获取、提取、存储、展示技术研究的基础上,综合考虑了旅游周期、旅游价格、景区类型、景区动态、交通状况、旅游安全、旅游季节、服务质量等等影响游客旅游体验的因素,设计了旅游路线评价模型。通过该模型可以计算满足游客搜索请求的每一个条旅游路线
图1
的值。为游客其个性化要求的旅游线路。通过图形化技术(MAP)友好的展示旅游线路,同时提供旅途中的餐饮、住宿、交通、景点动态信息等等旅游相关信息。帮助游客在出发前决策旅行线路,并充分了解旅途中的相关信息,以便为旅行做好充分准备。3.2系统总体结构设计
基于垂直搜索引擎的旅游线路系统主要包含以下三大部分:旅游数据采集系统、决策数据生成产系统、旅游线路搜索系统。
(1)数据采集系统数据的采集、格式化存储是本系统的核心之一。数据来源有两种方式:爬虫程序采集、管理端人工录入。主题爬虫在Heri-trix的基础上进行扩展定制,实现面向旅游的主题爬虫程序。由于本系统对数据的准确度要求比较高,因此对一些结构化显示的数据采用模板匹配的方式进行较为准确的抽取。对于一些非结构化的网页数据,信息往往蕴含在长篇的文章中。这类信息首先采用向量模型的方法进行分类过滤,然后采用HTMLParser与正则表达式技术相结合的方法提取主体信息。由人工参与信息的提取与审核。
(2)决策数据生成系统
在数据采集的基础上,将所有的数据进行格式化存储。系统数据分为三个部分:路线数据、路线相关动态信息、其他旅游资讯。将路线数据以XML的格式进行存储,并建立索引,方便路线搜索。路线相关动态信息是进行路线评分的重要依据。其他旅游资讯将做为路线辅助资讯在用户界面上予以显示,增加信息量,提高友好度。
(3)路线搜索评价系统
系统根据用户给出的初始条件(例如:出发城市、目的城市、景区类型、旅游天数、费用预算)在路线索引中进行筛选,获取符合用户要求的旅游路线,并根据路线评价模型进行排序。后将结果返回到用户的界面上,并从数据库中查询出与路线匹配的旅游资讯信息进行异步展示。3.4旅游线路的动态评分模型设计与验证
3.4.1旅游线路的动态评分模型设计
不同的旅游线路之间的评分是一件比较困难的事情。因为旅行线路有长有短,景点也有不同等级。很多路线往往不具有可
致谢:在此感谢本文研究的资助方:登巅科技netsget文旅数字化项目组的全资支持,和电子科技大学和常州大学DIR研究中心同事们的
共同努力。
24
科技创新导报 Science and Technology Innovation Herald
技术创新
比性。因为很难找到一个通用的可以量化的计算方法对异化的旅游线路进行公平的评价。因此本系统将在路线相当的情况下对旅行线路进行评价。所谓路线相当在此理解为旅游费用相当、旅游时间相当。
游客们对旅游线路的评价多来自于游客自己的亲身体验。我们可以从游客体验的角度来设计旅游线路动态评价模型。所谓动态,就是由该模型计算出来的值应该随着影响游客体验的事情的发生而发生变化。
3.4.1.1动态评分模型设计需满足的要求
(1)对同一旅游线路在不同时期的值,应该随影响因素的变化而变化。(2)能够考虑到不同路线的实际异性,要做到灵活、通用。(3)对不同的路线进行评价应该考虑到公平性。
旅游线路会受到一定因素的影响,我们进行仔细分析,得出影响因子分为以下两种类型:
(1)决定性因子F(影响到景区旅游的可行度)如:道路故障、卫生安全(传染病)、自然灾害(山洪)、景点整修等不可预料的其它情况。(2)非决定性因子f(影响景区的完美度)如:天气因数、服务质量。
3.4.1.2动态评分模型的设计
对一条旅游路线的评价,分为两个步骤。
步,对路线中所有的进行评价,计算景点的当前值。第二步,综合路线中所有景点进行评价,对路线进行综合评价。
动态评分模型是本系统的
核心部分,其结构如图1。
风景点的值计算公式为:
2010 NO.18
Science and Technology Innov科技创新导报
g:风景区的等级
fj:的取值范围0~1,状态下 Fi、
值为1,状态下值为0
r的值越大 度越高,值越小 度越低。等于0时表示此线路不可行。
线路值计算方法
:设线路上有n个景点, ri表示第i个景点
mi表示景点间线路因子,表示路线的值。
的通畅程度。M表示整条路线的通畅因子。
M(2)
则线路的 R (3)
r=g f
im
(1)
F:第i个决定性因子的状态值;j:第j个非决定性因子的当前状态值
n:决定性因子的个数;
m:非决定性因子的个数;
公式(3)综合考虑了景点质量、决定性影响因子、非决定性影响因子、线路通畅因子等等因素。通过公式(3)可以计算出每个可能的路径(线路库中线路、游客自定义线路)的值。给出旅游路线当前排名,同时也可以十分容易的分析得出影响值的景区及因子,让游客知道评分的客观依据。
3.4.2旅游线路的动态评分模型的测试
旅游路线公式综合考量了景点质量、决定性影响因子、非决定性影响因子等因素。我们设置了几组数据,来模拟测试一下结果。
F3卫生 F2景区交通、设: F1景点状态、
f2星期因 f1季节因素、 F4自然灾害、安全、
f3服务因素素、
计算结果为: r1={3.98、2.21、2.39} R1=2.76 r2={2.24、2.21、2.39} R2=2.28 r3={3.98、3.31、2.39} R3=2.99 r4={0、2.08、2.39} R4=0测试一个关键因素变化的影响:
R1=2.76 R2=2.28
测试一个非关键因素变化的影响:
R1=2.76 R3=2.99测试一个关键因素、非关键因素为0的影响:
表1测试数据1
R1=2.76 R4=0
通过模拟测试我们发现,我们发现公式(3)具有以下特性:
(1)关键因子的浮动对线路值的影响比较大。(2)非关键因子的变化对线路值的影响相对较小。(3)当某一关键因子出现问题时(值为0)对线路的影响是致命的,某一非关键因子出现问题时(值为0)不会对线路值造成致命的影响。(4)由于F的可扩展性,系统比较灵活,能够较好的包容不同旅行的异性。(5)本公式是在旅游天数、旅游费用相近(路线的可比性比较强)的前提条件下进行的评比,还是能较好的体现公平性的。
综上所述,经过试验分析说明公式(2)完全满足我们设置旅游路线评分公式的3个基本条件。
4 结语
本文介绍的基于垂直搜索引擎的旅游线路系统,有两个主要特色,一是能根据旅客的初始要求搜索满足要求的旅行线路,并能根据线路模型计算值,将度高的旅行线路展示在用户面前;二是系统可以在地图上形象的展示与每条旅行线路相关的所有常见的旅游资讯。
本系统在旅行线路的基础上,通过旅游线路将相关的旅游资讯关联起来,游客通过本系统可以十分便捷的获取想要的旅游信息。在节省信息搜索时间的同时,大大提升了信息搜索的服务体验。
参考文献
[1]肖冬梅.垂直搜索引擎研究[J].图书馆
学研究,2003(2):87.
[2]李盛韬.主题WEB信息采集的研究与设
计[M].:清华大学出版社,2003:488~494.
[3]王春龙.基于网站语义结构的信息抽取
系统的研究与实现[D].交通大学硕士学位论文.
[4]贺令
亚,
柳佳
刚.
基于
Web
的包
装器技
术的现状与
发展
[J].
电脑
开发
与应
用,
1003
—5850(2007)06—0027—03.
表2测试数据2
科技创新导报 Science and Technology Innovation Herald25
互联网行业高手们,垂直网站运营是什么意思
针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。#4学互联网技术不一定在本地呢 多看看专门的电脑学校目前学计算机 还是挺不错的好就业,计算机分很多专业如平面设计,UI设计,互联网营销,,动漫,都是非常好就业的专业哦,选择自己喜欢的专业有机会的话去电脑学校看看的 对比看哈好点咯