默认冷灰
24号文字
方正启体

第八十九章 备受关注(求收藏、推荐)(1/2)

作者:疯狂的鲶鱼
方远虽然火起来了,但是他还没有“飘”起来。

以他现在的水平来说,在本科生中可以说是出类拔萃的了!

特别是他有着其他本科生没有的实践经历。

但是相比那些真正的牛人来说,他的实力还是不够看的。

但是年级才是他最大的资本,在今后的几年时间里都会是他飞速进步的时期。

这个时期可能就是玄幻小说里面说的厚积薄发的时期。

前面十几年时间积累的底蕴,将会让他在这段时间内得到最大的进步。

和别人不一样的是,方远在释放潜力的同时,在系统的帮助下加强自己的潜力。

通俗点说,方远飞速进步的持续时间要比其他人更长一些。

也就是说方远能在这条路上走的更远,变得更强。

翻译软件其他方面都很好解决,方远毕竟有编写qoqo的经验。

但是有一点并不是很好解决的,那就是语言数据库和词库的建立。

为什么要建立这两个东西呢?

那就要从现在市面上翻译软件的弊端说起了。

现有的翻译软件只能对我们输入的文字或语音进行直译,也就是说它们不会根据语境进行翻译。

特别是语音方面,现有的技术对于一些方言的识别率着实让人头疼。

但是方远要做的这款软件可以完美的解决这个问题。

关键就是上面说的两个数据库的建立。

不仅仅要建立这两个数据库,还需要对二者进行关联操作。

除了这两个数据库之外,还有一个匹配库需要方远来完成。

这里面的关系十分复杂。

这款智能翻译软件,首先通过匹配库,对你当前的使用场景(默认为最常使用的场景)进行识别。

然后通过语言数据库中的资料对你输入的文字或者语音进行拆分。

用拆分出来的各个小单元在在词库中进行匹配。

并且按照翻译后语言的语法规则进行重新排序。

并且在语音输入方面进行了一定的优化处理,可以通过语言库中的数据,对方言进行良好的识别。

说来说去,最重要的就是语言库的建立。

这方面系统也为方远想好了办法,就是通过爬虫的办法,通过对短视频网站、直播网站、自媒体网站等进行数据获取。

当然这个过程并不是短时间内可以完成的。

而且对计算机配置的要求非常高,方远现在用的x星人电脑根本就支持不了这个软件的需求。

好在上次去“九州”公司的时候,他听到刘志军说道公司目前还有几台服务器暂时是空余的!

这也省了方远很大的功夫。

拿起电话,向刘志军说明情况后,这几台服务器的使用权就暂时交给了方远。

实际上,对于汉语的翻译是所有翻译软件头疼的事情。

经过五千年历史的沉淀,汉语的语意是所有语言中最复杂的情况。

特别是现在非常火的东北话,里面有很多词的对应词库是非常难以建立的。

这里就不得不感慨系统的厉害之处了!

在整段程序中,语意匹配算法是方远最喜欢的地方。

这里通过一个数学模型,建立文字和语意匹配模型。

所有字都相当于一个模型,一句话中有多少个文字,就相当于多少个模型相连接。

这样,只需要对每个模型进行处理,就可以得到这个字在这段话中的意思。

说起来复杂,实际上就是把每个字的所有意思都关联起来,然后词库中找到对应的意思即可。

接下
本章未完,请翻下一页继续阅读.........
(←快捷键) <<上一章 投推荐票 回目录 标记书签 下一页>> (快捷键→)