返回第1765章 遇到问题,分析问题,解决问题  重生87:开局截胡港岛女神首页

关灯 护眼     字体:

上一章 目录 下一页

最新网址:m.92yanqing.com

贾瀞雯回到北京时是周一早上。

她没回家,直接拖著行李箱去了办公室。

团队五个人都在,正围在白板前爭论什么。

看到她进来,所有人都转过头。

“贾总回来了!”

“陈总有什么指示吗?”

贾瀞雯放下行李箱,脱掉外套:“先说说你们这边的进展。”

李明赶紧匯报:“索引结构优化做了第一版,测试结果显示查询速度能提升百分之二十左右。

但有个问题,內存占用增加了。”

“分词算法呢?”

张涛接过话:“常见歧义解决了一部分,但遇到新的问题。

比如『南京市长江大桥』,可以分成『南京市长-江大桥』,也可以分成『南京市-长江大桥』。

这种结构歧义,靠词典解决不了。”

贾瀞雯点点头,走到白板前。

她拿起笔,在空白处写下几个字:超链分析。

“陈总提出了一个新概念。”她转身看著团队,“叫超链分析。

简单说,就是通过分析网页之间的连结关係,来判断网页的重要性。”

五个人都愣了。

“连结关係?”王磊问,“什么意思?”

“一个网页如果被很多其他网页连结,说明它可能比较重要,比较权威。”贾瀞雯解释,“反过来,如果一个网页连结了很多重要网页,那它自己可能也是个枢纽。

通过分析整个网络的连结结构,我们可以给每个网页打分,这个分数可以用於搜索结果排序。”

会议室里安静了几秒。

李明眼睛慢慢亮起来:“这思路……太牛了。

等於是把整个网际网路当成一个投票系统,每个连结就是一票。”

张涛也反应过来:“对!这样就能解决垃圾页面堆关键词的问题了。

那些垃圾页面不会被其他页面连结,分数自然低。”

“但实现起来很难。”王磊皱起眉,“我们需要分析整个网络的连结结构,这计算量太大了。”

贾瀞雯放下笔:“所以陈总说了,先做简化版。

不分析整个网络,只分析我们已收录的十万网页。

先验证这个思路是否可行。”

她看著团队:“陈总给了两周时间。

两周內,我们要做出超链分析的第一版,集成到排名算法里。”

任务定下来了,但怎么开始,谁都没底。

第一天,团队在查阅资料。

超链分析这个概念,国外有论文提到过,但没见到实际应用。

他们需要自己从头设计算法。

第二天,李明在白板上画出了第一版架构图:“我们需要建两个矩阵。

一个记录每个网页的出链,一个记录入链。

然后叠代计算,直到收敛。”

los angeleslos angelesdating

“收敛条件呢?”

“每个网页的分数变化小於某个閾值。”

“计算量还是大。”张涛摇头,“十万网页,矩阵就是一百亿个元素。

现在的伺服器算不动。”

第三天,陈浩打电话来了。

“遇到困难了?”他问。

贾瀞雯实话实说:“算力不够。

团队说矩阵太大,叠代计算需要的时间太长。”

电话那头沉默了一会儿。

“可以简化。”陈浩说,“第一,不需要算所有网页。

本章未完,点击下一页继续阅读。(1 / 2)

『加入书签,方便阅读』

上一章 目录 下一页