一、基础数据入库 1、5万条文本数据,词整理入库; 2、以数据库方式存储词典; 3、准确率≥98%; 二、蒙文版微信小程序“蒙语音集”的设计与开发 1、功能需求 系统架构和关键技术主要借鉴于“九州音集”小程序,采用蒙古文用户交互界面,实现蒙古语的语音数据采集、播放、展示、分享、发布和下载等一系列功能。具体包括以下几个方面: (1)发音人信息登记与用户权限管理 系统将为不同用户分配不同权限:一级用户具有录音上传的权限,需登记用户的基础信息(年龄、性别、教育程度、民族等)、母语信息(母语经纬度和地理位置、母语类型、方言类型、母语使用情况、母语使用水平等)和联系方式等内容。普通用户只分配一级权限,即只能录音和上传语音数据,二级以上权限由系统管理员分配。二级用户可以建立和管理自己的目录和条目。三级用户可以将自己新建的目录分享给其他用户,邀请其他用户提交相应的录音材料,并对录音材料具有删除、编辑和标记等权。四级用户可以收藏其他用户发布的语音数据资源库。五级用户可以发布自己的语音数据资源库。 (2)目录和条目的新建与管理 二级以上用户可以自由新建和管理自己的目录与条目,其功能类似于电脑端的文件资源管理器,用户可以新建、修改、删除和移动自己的目录和条目,用户可设置目录或条目的标题及备注说明信息。系统支持五级子目录、每个目录下可包含100个具体条目。用户建立好的条目可以用于采集自己的语音数据,也可以发给微信好友或者微信群,请其他用户帮忙录制语音数据。 (3)语音录制与参数控制 一级用户可基于微信程序接受录音任务,针对各个条目录制MP3格式的音频文件并自动上传至服务器保存起来。在录音之前,录音人可设置录音参数,包括发音类型、录音采样率、语言类型或属性、发音水平、单个条目最大录音时长等参数,这些参数跟各个条目的声音文件同步保存,可用于后期的语音条目筛选。另外,系统还将为录音人提供便捷高效的录音操作,如录音数据自动上传保存、录音完成后自动跳转至下一个条目,未录制的条目自动置顶显示等。 (4)语音播放与地图展示 录音人可以在录音页面播放自己上传的语音文件,也可以在地图页面播放同一个语音库中其他发音人录制的语音文件,还可以基于一定的条件对语音数据进行筛选,如设定发音人姓名、发音人的地理位置、语言类型或属性关键字、发音水平等条件。系统可根据发音人的地理位置信息在地图上对语音条目进行展示和播放。 (5)语音分析、图谱制作与在线编辑 在手机等移动设备上实现语音声学参数的基本分析功能,可呈现波形图、宽带语图、窄带语图、音高图等语音图谱,帮助研究人员随时随地了解语音的声学特性,并在此基础上实现简便的语音数据编辑操作,如声音片段的截取保存、截取删除等。 (6)语音标记和备注 在手机等移动设备上实现语音播放和记音功能,还可针对各个语音条目添加相应的备注和评价等信息。记音信息对于所有用户均是可见的,而备注信息针对面向发音人,可用于条目创建者和发音人之间的信息交流。 (7)数据发布与分享 在语音数据库制作完成之后,目录创建者可以发布或分享出来供其他用户使用,以实现语音语言数据资源的共建和共享。 (8)动态令牌与权限转移 目录创建者可以设置和修改自己的动态令牌,并将其分享给其他用户,其他拿到动态令牌后,可暂时获得目录创建者的部分用户权限,如记音和备注权限、语音条目删除权限、语音条目编辑权限等,以便于目录创建者招募更多的参与者来帮助其完成语音库的建设和管理工作。 (9)语音数据下载 条目创建者可以下载某个条目的所有发音人的录音,也可以下载某位发音人的全部条目的录音,还可以将动态令牌分享给其他用户,使其他用户具有相应的下载权限。 2、性能要求: (1)要全面支持安卓和苹果等操作系统,并优化适配手机、PAD和PC端,努力做到多屏联动,以充分发挥不同终端设备的性能和操作优势,如可利用手机或PAD来完成语音数据采集,利用PC进行语音数据编辑和分析等。 (2)要注重提升用户体验,努力做到好用和易用,要尽量修改微信小程序服务平台所汇报出来的各类程序性错误,在性能指标上要达到“优秀”级别。 (3)要注重数据访问的安全防护工作,确保语音资源库的数据安全。 (4)要尽量提升程序代码的执行效率,降低计算和访问压力。 (5)要注重数据资源平台的通用性和可扩展性,要支持字、词、句、篇章、故事等不同类型材料的语音数据采集,并且要提供数据筛选和查询等功能,最好还具有图片上传和短视频录制等功能。 三、系统技术架构 1、前端采取“微信开发者工具”进行开发; 2、后台采取PHP+MySql; 四、产品知识产权与归属 1、软件产品需要为自主开发,不存在与任何第三方的产权纠纷; 2、产品交付后需提供完整可执行的源代码,以保证产品的永久使用。 四、编辑工具: 1、蒙古文编辑器:实现所有文本数据的拉丁转写,编码校对正确,音节结构、IPA转写、音节个数统计; 2、准确率:准确率≥98%; |