第149章 TT智译(1 / 2)

科技衍生 前朝的孤 1383 字 2022-12-28

凡语要想彻底颠覆社交领域,做facebook、twitter的终结者,仅凭当下的完美翻译远远不够。

还需要更进一步,拥有更多的卖点!

当下社交软件的交互,不仅局限于传统的文字,更是包含视频、语音等等。

更重要的是,互相之间的综合交互,例如语音和文字之间的转译。

因此,凡人论坛或者凡语,要颠覆整个领域,逃不过与时俱进。

视频交互容易解决,没多少难度,然而语音就不同了。

尽管当下智能语音输入软件颇多,但精准度以及模糊识别一直是个大问题。

当用户对着语音输入法,兴奋地说了一堆话,结果识别错误颇多,掉字连连,甚至连语义都扭曲了。

至于那些不标准的普通话,以及方言,结果更是惨不忍睹。

说是鸡肋都不为过。

更何况王凡要求的更高!

他想要将一种语言的语音,翻译成另一种语言的语音。

完美实现不同语言之间的对话交互,而不是单纯地局限在文字上的完美交互。

例如英语和华夏语的对话交互。

这需要将英语的语音,转为英文。然后完美翻译成华夏文,再度读出来,变成华夏语,从而传递给另一个人。

反义亦然。

整个过程要确保准确无误,尤其是第一个过程,语音到文字,一旦出现错误,后面整个过程都会出现问题。

而两种文字的完美翻译,当下已经实现,至于最后的文字到语音的阅读,那更不是问题。

只是如此精准地将语音识别,这种近似“智能”的过程,王凡凭自己的力量当然搞不定。

即便当下全球领先的巨头,依旧局限在“模糊识别”的不精确阶段。

不过通过科技衍生系统,一切都将与之不同。

王凡亲自挑选了一些语音识别软件,讯飞、千度、灵犀、云之声、googlenow、siri以及微软cortana。

一番比较,各有千秋。

讯飞、千度、灵犀等,比较适合华夏,但对国际方面的处理不太给力。

而googlenow、siri以及微软cortana,则擅长国际,很多华夏方面的做不到位。

一番权衡,王凡最终选择了googlenow,这款综合性比较优越的语音识别软件。

在此基础上,王凡衍生出一款新的语音识别软件——tt智语。

一番测试,这款语音识别软件的强大让王凡赞不绝口。

不仅能智能识别华夏语、英语、俄语、法语等常用语言,还能识别俚语。

即便王凡对着tt智语爆粗口,都能智能识别或模糊转译。

之所以有些模糊转译,是因为很多方言或者粗口,太过“高端”,当下还没有具体的汉字与之对应,连我们都写不出。

不过很快王凡发现了问题,对于普通话或者近乎普通话,智能识别准确率几乎百分百。

但对于方言音频的识别,有些差强人意,准确率只有百分之九十左右。

尽管这一比例已经很高,足够用户使用。但作为系统出品的黑科技,还是有些不够看。

另外,对于方言音频的识别,会出现两个版本。

例如智能识别《咱们屯里人》时候,出现了两个结果。

一个是标准的普通话版,一个是直接识别的版本:偶滴老嘎,就组在则个屯。偶系则个屯里,土生土长滴羊……