学、数字信号处理技术、多媒体技术等多个学科技术,在目前还属于一种非常前沿的技术,很多it巨头如ibm、微软和公司都投入了巨大的人力和物力在进行这方面的研究,并且取得了一定的成果。
tts技术,进行文字和声音频率的对应是非常简单的,最能体现技术的地方在于其转换时间的长短、语音音律之间是否流畅、发音是否自然等等。
简单地将音频和文字对应,虽然可以让文字发声,但是在上下文过程中的切换在人耳听来,会显得格外的生涩,一听就知道是机器人在发声,这也是很多影视作品中,区别机器人和人类的一个重要特征。
很显然,林鸿要做的语音发声引擎,并不是这么简单,他必须让林小星发声之后,别人根本听不出什么生涩感,就好像是真人在说话一样。
原本要做到这一点,短时间内肯定是无法完成的,毕竟这方面所涉及到的技术不少,林鸿必须着手去建立相应的语音数据库、习惯语法库之类的库,而这部分工作是非常消耗时间的。
不过现在有了林小星,并且其他大公司也做了很大一部分这方面的工作,林鸿现在要做就变得非常简单了。
林小星帮他搜集了很多有关这方面的资料,他可以直接利用那