(20140404)网络信息采集课程教学研讨(文本)Word文档格式.docx
《(20140404)网络信息采集课程教学研讨(文本)Word文档格式.docx》由会员分享,可在线阅读,更多相关《(20140404)网络信息采集课程教学研讨(文本)Word文档格式.docx(3页珍藏版)》请在冰点文库上搜索。
课程目标
通过“网络信息采集”课程的学习,学生能够了解网络信息采集的基本知识以及网络信息采集技术的发展;
初步掌握使用采集软件进行信息采集的方法;
掌握搜索引擎、邮件列表、新闻组、FTP、即时通讯工具等信息采集工具的使用方法及技巧,能够熟练运用采集工具进行网络信息的采集;
掌握数码相机、数码摄像机、数码录音笔的使用方法,能够熟练运用其进行多媒体信息的采集和处理;
能够进行网络原创内容采集;
掌握网络新闻采访方法,熟练运用各种方法采集所需新闻信息;
初步掌握网络原创信息的写作。
课程教学建议
建议把教学内容与实训内容结合进行,再联系实际就更好了。
比如下面列出了一种可能的结合方式:
1.网络信息采集软件的使用
利用网络信息采集软件搜集某城市旅游景点信息
2.使用常用和专业搜索引擎收集信息
实训1.Google和百度的使用一搜集某城市的发展历史以及城市文化
实训2,专业搜索引擎的使用一搜集某城市相关的图片信息以及音频信息
3.常用的网络采集工具的使用
实训1.建立邮件列表一订阅某城市相关的邮件列表
实训2.使用outlook客户端软件设置新闻组一参与关于某城市话题的讨论
实训3.使用匿名FTP下载关于某城市的各类信息
实训4.使用即时通讯软件msn和qq—添加一些某城市地区好友,沟通了解某城市的发展变化和城市文化。
4.图像、视频、音频信息的采集与加工
实训1.摄影一数码相机使用,拍摄多幅某城市市容市貌人文等方面的图片
实训2,摄像一数码摄像机使用,录制关于某城市的城市建设、精神文明建设方面的内容,使用编辑软件进行剪辑实训3,录音一数码录音笔使用,为拍摄的视频配音
5.网络内容原创
实训1.面对面采访一采访一位某城市普通市民
实训2,电话采访一采访某城市市政府部门的一位领导(围绕城市建设方面)
实训3.电了邮件采访一采访某城市某高校教授
实训4.聊天室采访一就某城市的交通、食品安全等问题进行采访
实训5.消息的写作一根据上述4个实训收集到的资料进行总结,形成一篇关于某城市市的历史变迁、发展建设、民生问题、文化教育方面的消息
6.综合实训
将图像文件、视频文件和音频文件进行整合编辑,输出为视频格式文件,涵盖某城市的历史变迁、城市建设、文化教育、精神风貌、人文景观、旅游度假、饮食文化、民生问题等方面的信息
网络采集技术可归纳为以下几方面:
一、 用计算机系统对网络信息进行抓取。
以对单个网页信息进行采集为例,其一般流程为获得网页的URL,识别URL所在主机(服务器),向该服务器发出请求、建立TCP连接,根据HTTP协议向服务器发出获取URL的命令,接收服务器的响应、读取URL对应的文件内容,将文件内容写入本地永久性存储,最后释放与服务器之间的TCP连接。
这个过程是以因特网上最基本的TCP协议为基础,通过与网络服务器建立连接,而后将信息下载到本地主机,从而完成对网络信息的采集,这个技术也是目前应用最广泛的。
二、 是网络信息挖掘技术。
网络信息挖掘技术主要利用数据挖掘技术获得可用的信息。
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识的过程。
三、 是网络信息的分析与过滤技术。
为了有效去掉绝大部分无关信息,必须采用分析与过滤技术来控制信息的采集。
四、 是网络信息资源的整合技术。
对所采集的信息可以按照主题或分类方式,利用计算机自动分类技术对其进行整合。
整合后的信息可以建立自有的信息资源搜索系统或建立专题文献数据库来为用户提供服务。
五、 是网络信息资源的发布与推送技术。
实时、动态、按科学分类的发布技术。
不但可以确保用户查找方便,也可以确保数据的全面及时。
网络信息采集技术的新发展
现在比较新的应用于网络信息采集的技术,有RSS技术、开放链接技术和基于OAI协议的信息采集技术。
RSS是在线共享内容的一种简易方式。
通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。
开放链接技术是一种解决不同的数字资源系统互操作、进行资源整合的方法,也是一项技术标准,还是一种附带有元数据信息和资源地址信息的“可运行”的URL。
可用来解决二次文献数据库到原文服务的动态链接问题,服务提供方维护的链接解析器能够在相关服务网页上动态生成开放链接。
OAI协议是一种独立于应用的、能够提高Web上资源共享范围和能力的互操作协议标准。
今天的教研活动到此结束,再见。