新闻动态⁄ NEWS&EVENTS

实时更新的网梯动态,了解最新的咨询和报道

【聚焦】融媒体,解锁图书数字出版新体验

2019-09-06



科学技术发展日新月异,潜移默化地影响着数字出版的形态。如今,5G技术与人工智能技术不断加速革新,在这样的背景下,如何尽可能地让技术与出版有序融合?成为当下最重要的机遇与挑战。

 

“融媒体图书综合解决方案”由北京网梯全新打造,可以帮助编辑和作者快速地完成图书配套音频资源制作、资源展示以及图书版权保护等工作。以高新技术为手段、以优质内容为核心、以用户体验为宗旨,打造移动互联网时代知识获取新模式,帮助出版社从版权模式到用户模式,文字出版到语音出版的互联网式转型发展。

 

声音即品牌,当智能语音能遇上数字出版

 

5G时代,市场对于音视频资源的需求量势必会大大增加,在这一情况下,高质高效地加快音视频资源开发迫在眉睫。但是长期以来,数字出版似乎存在着无法轻易跨越的人与机器之间的沟通鸿沟,如何弥合人与人之间的交流互动,得到最美好的语音体验?网梯落地了产品化的基于端到端的深度神经网络的语音合成系统,语音合成技术可以将文字转换成语音,根据第三方主观打分,基于深度神经网络的计算机合成的声音几乎能够达到真人录音的水平。

以往,传统技术定制的语音模型,由于需要发音人录制成千上万句话,一般需要耗费几个月的时间,成本巨大。网梯落地的基于深度神经网络的声音定制,所需训练数据量少,几百句话就可以训练出一个逼真和自然的人工智能声音,对于出版社编辑与作者而言,操作流程简便,大大节省了时间成本,且“模拟人音”可以很有效地扩展到多种说话的风格,活泼轻快?端庄稳重?严肃威严?各种声音风格任您pick!

 图片2.png

 

(编辑与作者登录后,可直接按照需求选择风格化配音演员、调整朗读速率、配音音量等)

 

我们更有优势

  1. 不断迭代的产品升级可以让用户持续使用到最领先的语音技术。

  2. 基于客户的数据,提供‘细粒度’的定制,包括语音合成的声音,风格,特色功能;语音识别的语言语音模型。

  3. 提供全面端对端的应用支持,缩短落地时间,提升落地效果。

  4. 操作简便,用户直接登录即可操作。

  5. 保证用户的数据的隐私和安全,值得用户信赖。

 

全书无码,图书内容与多媒体内容有机结合

应用于图书出版领域,人工智能技术有着更大的发挥空间。对于传统图书出版而言,数字化转型不仅仅是图书内容的数字化加工,而是深层次、多样化地将纸质图书内容与多媒体内容进行有机结合,进而提供更形象、更深入的学习效果。而要实现多媒体内容和纸质图书内容的有机结合,关键技术是要实现智能手机或PAD对纸质图书内容的精确自动定位和检索,根据定位结果,在线学习系统自动推送匹配的多媒体内容给用户,供用户进一步拓展纸质图书的教学内容。但是目前的应用方式或操作复杂,或对识别精读要求高,或模型庞大,难以实时处理。

为彻底解决这一问题,网梯提出了一种新的方法,将OCR技术和全文检索技术进行结合,来实现书页自动定位。这个方法分为两个大的步骤:(1)将书籍的电子文档,如pdf等,按照页面生成一个个单独的数据记录,并生成书籍全文检索数据库。(2)通过手机摄像头随意拍摄书页图像后,自动传输到云端,并在云端调用SSD、CRNN等深度学习模型自动识别图像中的文字,送入书籍全文检索数据库,使用自动搜索技术匹配对应的书名和页面。

 图片1.png

 

我们更有优势