完整word版音频识别app软件立项报告与项目计划书Word格式.docx

上传人:b****2 文档编号:3069627 上传时间:2023-05-01 格式:DOCX 页数:16 大小:216.42KB
下载 相关 举报
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第1页
第1页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第2页
第2页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第3页
第3页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第4页
第4页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第5页
第5页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第6页
第6页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第7页
第7页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第8页
第8页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第9页
第9页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第10页
第10页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第11页
第11页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第12页
第12页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第13页
第13页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第14页
第14页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第15页
第15页 / 共16页
完整word版音频识别app软件立项报告与项目计划书Word格式.docx_第16页
第16页 / 共16页
亲,该文档总共16页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

完整word版音频识别app软件立项报告与项目计划书Word格式.docx

《完整word版音频识别app软件立项报告与项目计划书Word格式.docx》由会员分享,可在线阅读,更多相关《完整word版音频识别app软件立项报告与项目计划书Word格式.docx(16页珍藏版)》请在冰点文库上搜索。

完整word版音频识别app软件立项报告与项目计划书Word格式.docx

快速关键音标检索系统,采用了基于语音内容的检索技术,能够在海量视音频中快速搜索和准确定位所要查询的内容,为多媒体语音和音频信息的检索再利用提供了新的技术手段。

1.5.项目融资计划概述

Listening听力服务播放器的发布与包装,这些都需要与各大出版社、教育部和培训机构合作共同完成,可以把Listening推广到各个语言学习领域,给使用者带来非凡的学习感受,积累客户群体,然后可以开发出高端的学习体验服务,可以让客户和使用者进行购买体验。

2.市场分析

2.1.行业分析

目前,对于视音频学习如何辅助语言教学的方式的改变,已取得了大量的研究成果。

讨论的焦点主要集中于如何进行听力资源选取以及如何将其高效地运用于音频播放器语言教学等方面。

例如:

结合学习者的兴趣和水平恰当地选择学习材料;

为学生设计相应的练习便于课后巩固;

组织学生进行模仿和讨论以加深印象等。

赤瑞特拉的研究也证实,人类通过交流,记忆的内容能达到70%。

以上的研究成果强调了教师的主导作用。

建构主义学习理论认为,学习是一个积极主动的建构过程。

学习者不是被动地接受外在信息,而是根据先前认知结构主动、有选择性地知觉外在信息。

如果脱离教师指导的环境,视音频资源将变成单向的信息灌输,不利于学习者理解其内容,这将影响学习者的兴趣和学习效率,Listening产品的提出就是为了解决这些学习问题。

产生此问题的根本原因在于,主流的视音频播放软件对视音频学习材料一直是单向顺序播放,缺乏对学习者个性化交互的支持,从而影响学习者主动性的发挥。

因此,如何对视音频播放软件进行改进,从语言学习者的需求出发,支持学习者个性化交互的需要,成为亟待解决的问题。

2.2.定位分析

Listening产品的定位就是为了让学习者更好的体验学习的快乐,提出了基于学习者的交互式多媒体语言学习软件包的设计模式,对语言学习软件的设计具有指导意义。

Listening将定义为一种用以创造探索性的学习环境的软件应用,在这种学习环境中,数字化声音、形象、文字、录像等组成部分通过计算机平台综合起来,置于学习者的直接控制之下。

软件要实现以下功能:

学习者针对不同的学习目标,在制定计划和选择课程内容方面起主导作用;

设计开放式的学习任务,允许学习者选择不同的路径来完成;

强调学习过程中学习者的参与度。

学习材料要提供给学习者参与的机会,使其成为语言学习中积极的贡献者,而不是被动的知识接受者;

软件设计中强调为学习者提供不同的学习风格,如视觉、听觉、触觉等,多角度提高学习者的学习体验。

2.3.核心竞争力分析

Listening听力服务播放器的难点是,如何提高学习过程中学习者的参与程度。

从实现学习者与学习资源交互的角度出发提出3种交互方式,分别为控制视音频材料的播放内容和播放次数、控制材料播放过程中的显示信息、支持为学习内容添加注解。

由学习者控制视音频材料的播放内容,语音搜索需要进行听力训练的位置,包括精确选择需要播放的片段、指定是否显示字幕及显示字幕原文或译文等、设定选定片段的播放次数;

学习者可对材料中的重难点进行标注,并在材料播放时加以提示等。

Listening这些功能的实现会打破未来听力服务播放器的定位模型,为学习者和出版社以及教育部都会产生非凡的影响。

将会打破国内外的数字播放器的格局,为音频播放器带来崭新的突破。

3.产品设计

3.1.产品架构

Listening听力服务播放器软件主要由基础框架、资源管理器、播放器和编辑器组成,如图3-1所示。

主框使用分割器,为整个系统提供了一个总体架构,各大GUI组件则放在其中。

资源管理器用来管理学习资源,播放器用以播放媒体,编辑器用来阅读学习材料脚本、标注重难点等。

主框协调各大组件,完成各种功能。

图3-1产品架构

Listening播放器的核心功能就是快速关键词检索技术,此技术是基于内容的音频分类和检索系统,是介于信息用户和音频数据库之间的一种用户信息服务系统。

图3-2给出快速关键词检索系统的系统框架。

在音频检索中,需要经过特征提取、音频分割、音频识别分类和索引检索这几个关键步骤,系统包括音频数据库生成模块与用户查询浏览模块两个部分。

图3-2快速关键词检索系统框架

3.2.产品功能

Listening听力服务播放器不仅包括网络播放器上的基本功能,这些基本功能主要包括:

打开文件、显示播放目录、播放、暂停、快进、复读、查找、字幕提示、电脑朗读、快速定时、永恒同步、电子阅读等;

更包括本项目的技术亮点功能,主要包括快速关键词检索、多音轨切换、日常语简单对话功能以及关键标签标注功能,下面一一介绍。

(1)电脑朗读功能:

电脑文本朗读是基于TS语音引擎,利用这个引擎电脑可以将文本以语音方式进行朗读,并且TTS语音引擎支持很多种语言。

转换功能可以将TTS语音引擎朗读的语音直接转换成音频格式,并且保存起来。

(2)快速定时功能:

该功能和播放器中的“快进/倒带”及“下一曲/上一曲”很相似。

然而,快速定时的时间跳转功能则要方便和快捷些,使用者可以将自行定义为按一次前进或者后退若干秒,比如20秒、30秒等。

(3)永恒同步功能:

永恒同步显示是指在播放听力训练音频时,其显示屏可以选择自动地同步显示所播放音频的听力字幕,这是一个非常实用的功能,尤其是听力训练或者学习英语时,对使用者的帮助是不言而喻的。

(4)电子阅读功能:

也就是电子图书功能,这是不限制文件类型的阅读功能。

其实早期的机型也支持TXT文本的阅读,但是却没有定位功能。

这就好比是翻阅一本没有编写页码的书,要想查找书中的某一页是十分的困难。

本播放器的定位功能就是给电子图书添加页码的功能,有了这页面定位功能,就可以通过选择所要阅读的页码,直接找到使用者所希望的阅读内容。

以上是Listening听力服务播放器具备的基本强化功能,Listening播放器功能如图3-3所示。

图3-3Listening产品功能图

(5)关键标签标注功能:

通俗表示就是“书签功能”,这是Listening中的音频定位功能。

既可以在记录过程中使用,也能够在播放过程中使用。

例如用Listening进行语言听力训练时,或者是记录名人激动人心的演讲,其中必然包含有若干个精彩之处,在记录的过程中只要在这些精彩处按Bookmark键,设定关键标签注释,自己可以定义名字做一个标记。

这样在今后重新听这个音频时,就可以通过已经设定的书签直接跳到这些精彩处,或是通过原音频已经标注好的标签进行跳转。

(6)多音轨切换功能:

该功能是在播放音频时,音频可以有单音鬼、双音轨以及多音轨。

在播放的时候可以为了更加清晰的、立体的进行听力训练,可以切换音轨,把单音轨切换至双音轨,甚至是多音轨,这些在播放器中实现,增强听力训练者的听力感受,是本Listening播放器的特色之一。

(7)日常语简单对话功能:

该功能是Listening播放器的特色功能,支持多语言的日常语简单对话,听力训练者在闲暇之余,可以简单的和播放器进行日常用户对话,不但增强使用者的听力能力,也同时会增强使用者的口语表达能力,多方面提高学习者的语言学习能力。

(8)快速关键词检索功能:

该功能是Listening播放器中至关重要的功能,此功能实现的关键点是关键词检测,是在一段连续语音中找出给定的目标词的发音所出现的准确时间段,并给出每个候选段的置信度。

本功能的实现会大大提高使用者在使用时的用户体验度。

3.3.产品性能要求

(1) 

区别于目前众多厂商采用的基于云计算大数据分析的识别技术,快速关键音标检索技术并不需要理解目标词汇和音频内容的具体含义和语义,不需要对语音内容进行识别。

(2)要求采用组成发音最小因素进行语音模式库的建设,国际音标(IPA)是发音最小因素的符号表示方法。

目前,国际音标组织已经完全标注全世界所有语言的发音,通过不同的组合,可以表示出任何的语言,任何的方言。

(3)不限语种、方言,可以准确的检索到字、词、句,适用于各类语言环境,只要该语言能够用国际音标进行标注,均可以检索,对中国多方言、多民族语种的环境特别重要。

(4)给用户带来方便快捷的听力学习体验。

4.商业模式与营销策略

4.1.项目商业模式

Listening听力服务播放器的商业模式模式其实是一种典型的C2C模式:

(1)所有出版社和教育机构都可以成为音频资料的提供者。

本平台对音频资料提供者有部分的资金回馈和严格对提供者者资料的限制。

(2)为资料提供团队提供方便。

资料提供者在注册之后,Listening就会为其提供ListeningSDK和相应的技术支持帮助设计上传学习材料音频。

同时,Listening团队会根据提供者的要求进行音频处理,把音频成功放到平台之上,可以很方便的在Listening这个平台上交易。

(3)帮助用户进行选择。

Listening通过排行榜、搜索等方式帮助手机节电脑用户很方便在平台上找到想要的学习音频材料。

这种模式强调的是在音频提供者与使用之间搭建平台,Listening只充当平台,帮助推广和支付,收取分成。

4.2.项目经营策略

Listening的营销策略是完全基于平台自身的自营销体系与合作模式。

以平台为中心,向上帮助音频资料提供者把资料推荐到用户眼前,向下帮助用户找到他需要的学习音频资料。

主要营销策略主要包括:

(1)搜索引擎:

帮助学习者根据关键词搜索找到想要听力类学习音频资料。

(2)排行榜:

按照用户的喜好,基于24小时的真实下载听力音频,推出各类音频排行榜。

排行榜不会显示过多的音频材料,让使用者眼花缭乱,而只是列举前8-10个学习音频材料。

(3) 

广告位:

为大型出版社和教育机构提供广告位。

其中,听力类学习资料排行榜是平台营销的最主要手段。

详细的分类排行榜可以划分出Listening上所有的听力音频文件。

5.开发计划

5.1.项目接口

互联网和金融接口列表,如表5-1所示。

表5-1互联网和金融接口列表

编号

接口名称

接口标准

入口参数

出口参数

传输频率

1

2

5.2.开发进度计划

开发进度计划列表,如表5-2所示。

表5-2开发进度计划列表

阶段名称

需求分析

概要设计

详细设计

编码

测试

包装

发布

第1周进度

需求培训

第2周进度

需求获取

第3周进度

第4周进度

第5周进度

需求确认

第6周进度

第7周进度

第8周进度

第9周进度

第10周进度

第11周进度

第12周进度

第13周进度

第14周进度

第15周进度

第16周进度

第17周进度

第18周进度

第19周进度

第20周进度

Alpha

第21周进度

第22周进度

第23周进度

第24周进度

Beta

第25周进度

第26周进度

第27周进度

第28周进度

5.3.评审计划

评审计划列表,如表5-3所示。

表5-3评审计划列表

评审日期

评审地点

主持人

参加人

应交文档

2015/05/30

第一会议室

部门经理

项目组员

用户需求报告/需求规格说明书

2015/06/15

概要设计说明书

2015/07/07

项目经理

详细设计说明书

Alpha测试

2015/10/07

测试人员

Alpha测试报告

Beta测试

2015/11/07

客户单位

客户代表

Beta测试报告

2015/12/01

销售人员

包装光盘,用户指南,广告材料

6.投资与风险

6.1.投资

6.1.1.人力资源投资

人力资源是为开发项目而组建的队伍。

可能的项目组织单元,如:

项目管理组、质量保证组、配置管理组、软件工程组、测试组、需求管理组。

各组织说明如下:

项目管理组,执行SPP和SPTO过程,对项目实施负全部责任;

质量保证组,执行SQA过程,负责项目过程与产品的质量控制和报告;

配置管理组,执行SCM过程,负责项目产品的版本、配置管理以及配置库状态报告;

软件工程组,执行软件项目工程过程,负责项目产品的开发和维护工作;

测试组,执行软件项目测试过程,负责项目产品的测试;

需求管理组,负责对需求基线和需求变更进行管理。

人力资源投入列表,如表6-1所示。

表6-1人力资源投入列表

需求岗位

需求人数

工作量(人/月)

到岗日期

分析师

10000

设计师

设计师高级程序员

8000

续表6-1

程序员

10

5000

测试员

5

4000

包装发布

包装师

总人数:

23

总工作量(人/月):

6000

6.1.2.设备资源投资

设备资源投入列表,如表6-2所示。

表6-2设备资源投入列表

设备名称

规格型号

数量

单价(元)

金额(元)

到位日期

工作办公桌

30

1000

30000

工作办公椅

500

15000

电脑配件设备

35

140000

环境网络设施

5000

6.2.风险评估

风险的概念可以从工程学、经济学、保险学、管理学等角度进定义,然而目前还没有一个为学术界普遍接受的定义。

综合有关风险的各种学科的观点,本文采用以下定义:

风险是指在特定的客观条件下,特定的时期内,某一事件的实际结果相对预期结果的不利变化。

仿照风险的定义,可以把软件开发项目的风险定义为:

软件项目在整个生命周期内,由于受各种环境的不确定性因素的影响,实际发生的成本、进度、质量等与预期结果的不利偏差。

对于项目来说,项目的一次性使其不确定性要比其它一些重复性的活动大许多,因而项目风险的可预测性也就差得多,而且一旦出现问题就没有机会进行补偿。

6.2.1.项目技术风险

Listening播放器采用快速关键词检索技术,在开发过程中,技术的准确性和置信度对不同的音频文件的支持需要强大的鲁棒性,因此在开发过程中,检索技术的突破是本Listening的关键之处,因此项目的风险首先要考虑技术首次应用到项目中的可行性。

目前此技术还尚未成熟,因此此技术是目标产品的最关键之处,因此存在技术风险。

6.2.2.项目市场风险

Listening听力服务播放器是国内首款以交互式为目的打造的一款学习辅助型音频播放器,在国内市场上是首例产品。

将音频播放软件进行改进,从语言学习者的需求出发,支持学习者个性化交互的需要,是本产品的理念,要做到这些需要更大的市场客户群体的支持,无论是各大教育机构还是出版社对产品的需要是必须的,以及市场人群对Listening的需要是重点。

6.2.3.项目政策风险

Listening听力服务播放器要做到开发环境较好,监管严格音频制度规范。

Listening作为交互式学习播放器市场的领军人,要接受教育部和各大出版社的监管,在营销手段、营销策略和资费定制等方面,要受到严格的审批。

这对Listening的业务发展将会有很大的负面影响。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中教育 > 高考

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2