数位资料委外制作需求规范精.docx
《数位资料委外制作需求规范精.docx》由会员分享,可在线阅读,更多相关《数位资料委外制作需求规范精.docx(14页珍藏版)》请在冰点文库上搜索。
数位资料委外制作需求规范精
數位資料委外製作需求規範
本案委請製作成數位格式之資料分成四大基本類別計有:
文字、影像、聲音、視訊等。
承包廠商應依本單位所提供之文獻資料原件內容,由本單位進行原件分類,依照本單位分類擇結果,再原件性質提供建議選擇最適之轉換數位格式貯存,經本單位同意後再行進行資料轉換。
進行資料轉換前廠商需依本單位所提供之待轉資料分類清冊逐項進行貯存格式確認,確認格式之清冊將作為驗收之依據。
基本處理原則:
1.原件為印刷出版物且內容以文字為主之資料,需製成pdf格式。
文件內含之影像處理依影像處理之原則處理。
文字內容可以光學辨識完成貯存且需完全校對處理;或依影像處理之,但處理方式需本單位同意。
2.原件為數位之文字資料者需以HTML方式轉出貯存提供瀏覽。
3.原件內容為影像者每一種均需製為三種類型:
分別用以提供線上預覽、網路傳輸及下載及永久保存。
永久保存時以原型資料大小尺寸進行數位資料轉換不進行壓縮貯存之檔案(1:
1模式)。
4.原件為聲音及視訊資料者需輸出兩種型式之數位檔案:
一則供永久存檔,一則提供即時播放使用。
5.資料運送及轉換過程不得損壞本單位提供之資料原件,如有損壞之情事發生依本單位所定之財產價格之三倍賠償,情形重大者得由本單位決定中止合約,不得有異。
6.廠商使用轉換資料之高速掃描設備及數位相機等相關設備型號及作業方式需經本單位同意,本單位有權選擇設備使用方式及流程控制方式。
7.進行資料轉換時,如因使用之之設備造成原件損壞之情事發生,依本單位所定之財產價格之三倍賠償,本單位得立即中止轉換作業。
情形重大者得由本單位決定中止合約,不得有異。
8.轉換之數位資料本單位得進行抽驗,資料不良率高於千分之一者,每一筆錯誤得依得標價之千分之三進行罰款。
資料辨識程度良窳由簽約前由廠商與本單位共同協商,雙方同意後併入合約執行。
9.資料轉換格式得依下列參考格式說明辦理,如有其他不同建議規範需經本單位同意後方得以變更。
參考格式說明
1.預覽式影像(Previewimage)或縮圖(thumbnailimage)
縮小尺寸的影像,用以條列呈現館藏目錄,讓使用者預覽之用,藉以決定是否要花時間取得較高品質的圖像。
色調深度:
8bitsperpixel
格式:
GIF
壓縮:
原生影像至GIF
影像大小:
約150x100到200x200pixels
2.服務(或參考)式圖像供網路傳輸及下載使用
用以提供可下載的較高品質圖像,高壓縮比,利於存取,影像解析度較永久保存之影像(archivalimage)小。
若原圖像為黑白則以灰階處理。
色調深度:
灰階-每像素8-bits;彩色-每像素24-bits
格式:
JJFIF(JPEG交換格式)
壓縮:
JPEG(灰階壓縮比約10:
1,彩色壓縮比約20:
1)
影像大小:
使用品質需求等級需求由本單位判斷。
中級品質從500x400至1000x700,並於契約中附帶640x480規格;高級品質從1000x700至4000x3000,完全不使用壓縮方式的圖像。
永久保存影像(Archivalimage)
完全不使用壓縮方式的圖像,提供使用者作為重製、壓縮處理或其他圖像處理交換之用。
色調深度:
灰階-每像素8-bits;彩色-每像素24-bits
格式:
TIFF(TaggedImageFileFormat)
壓縮方式:
不壓縮
影像大小:
3000x2000至5000x4000;只儲存最高解析度圖像。
全文影像資料
全文影像資料以黑白雙色影像處理之。
黑白影像:
每像素一位元
格式:
TIFF
壓縮標準:
ITUGroupIV
解析度:
300dpi
聲音資料
每一筆聲音記錄需製成兩種類型的數位聲音檔案。
第一種是可永久存檔的檔案。
第二種是串流(streaming)式檔案,可在傳送的同時立即播放。
一、永久存檔型檔案:
Attributes:
22.05kHz取樣率,16bitword,立體音
格式(檔案類型):
WAVE(Microsoft格式)
二、串流(streaming)檔案:
編碼:
14.4數據機
格式(檔案類型):
RA(ProgressiveNetworks的RealAudio格式)
MP3格式
視訊資料
每筆資料需製成兩種類型的數位動態影像檔案。
一為下載型高解析的檔案以MPEG-1格式;另一種為streamingvideo檔案則以RealVideo的使用(配合錄製聲音的RealAudio檔案)。
動態影像檔案類型:
檔案大小:
320x240像素
格放速率:
每秒30格(frame)
資料傳輸率(Datarate):
約1.2megabits/秒(約150kilobytes/秒)
壓縮:
MPEG-1
格式:
mpg
各種資料數位化檔案格式(參考資料)
各種資料數位化時,必須考量到使用者的設備、使用的便利性、資訊檢索的需求、網路上資料的傳輸速度、資料的永久保存等問題。
有關各種資料數位化的方法及標準,再詳細說明如下:
文字資料相關標準
一、SGML:
SGML的全名為Standardgeneralizedmarkuplanguage(標準通用標誌語言),是ISO於1986年對文件轉換所制訂的國際標準語言,用以描述文件之結構及其屬性的語言。
SGML是一套資料編碼系統,使資訊獨立於出版和傳遞媒介之外,文獻可在不同的機器與軟體之間以相同的方式編碼與傳輸,因此資訊得以共享。
SGML提供一個設備中立的介面,且是正式的國際化資訊交換標準,因此它被廣泛運用在開放系統環境之中。
發展SGML的目的如下:
(1)資訊共用:
由於各種文件的標誌是個別獨立的,因此無法做出跨平台、跨系統的使用,因此SGML的設計就是強調處理文件的結構與資訊共用。
(2)系統獨立:
SGML可以適用於目前與未來不同廠商所製造的各種系統。
(3)硬體獨立:
SGML不會因為硬體的更新而無法使用。
(4)語言獨立:
SGML可以適用於各種不同語言OR語系的國家。
(5)應用獨立:
SGML可以適用簡單的文件,也可以適用於複雜的文件。
二、HTML:
HTML的全名為HYPERTEXTMARKUPLANGUAGE,它是SGML的一種應用。
換言之,HTML是SGML的一種文獻類型標示(DTD:
DOCUMENTTYPEDEFINITION)。
它的優點如下:
(1)適於撰寫、交換抄媒體文件
(2)易學易用
(3)模組化
(4)擁有眾多的轉換工具
(5)資源共享
至於它的缺點則有下列數點:
(1)不能精確地控制一個媒體物建在螢幕上的位置
(2)缺乏表達時間關連的能力
(3)對群體工作的支援不足
三、XML:
XML的全名為THEEXTENSIBLEMARKUPLANGUAGE,是SGML的一種應用程式。
XML主要是針對HTML過於簡化以及太僵化所加以設計的文件交換介面。
在未來的社會,對於網路資源的大幅需求以及資訊媒體的多樣化,XML可以解決上述的問題。
同時,XML對於HTML的文件可以相互的轉換,以達到資訊流通上的便利。
四、PDF檔案
PDF格式使用在AdobeAcrobat這套電子出版軟體中。
這種格式可以應用在Unix、Dos、Macintosh、Windows等不同的平台(AdobeSystem公司提供了在各個平台上的AcrobatReader瀏覽軟體來觀看PDF檔案)。
在儲存PDF圖檔時可以選擇用JPEG或是ZIP格式來進行壓縮。
由於一般的WWW瀏覽器可能無法直接瀏覽此檔案格式,所以不能直接放到網路上供一般的瀏覽器瀏覽。
不過可以考慮製作一系列的PDF檔結合影像跟文字在下傳給使用者透過AcrobatReader來瀏覽這些文件。
圖片資料數位化相關標準
一、前言
要將圖片資料數位化通常要考慮兩個問題:
1.圖片的品質(包括解析度,色彩模式(黑白、灰階、全彩)2.檔案大小。
如過要把數位化以後的資料放到網路上供人瀏覽則還要考慮到另一的問題,即3.瀏覽器的支援。
前兩個問題通常是相對的,解析度愈高、色階越多影像就越細緻,而相對的檔案的大小也就愈大。
而透過壓縮的方式則可以減少檔案的大小,不過軟體在save&load這個imagefile時所花的時間也會增加,但就現在電腦的運算能力來說這部分應該不是問題。
然而有些圖檔的壓縮方式是採破壞性壓縮,這會使圖形的某些部分失真而影響圖片品質。
所以視我們將圖片數位化後用途的不同應該有不同的考量重點。
例如若是要產生一個永久的保存圖片(ArchivalImage)則圖片的品質應該是考量的重點,若是要在網路上提供使用者瀏覽,則檔案大小就變成優先考量的問題。
以下先介紹一些常見的圖檔格式以及其適用時機:
二、影像壓縮標準
1.TIFF格式
TIFF格式一般應用於不同平台、不軟應用軟體上,在影像列印規格上受到廣泛支援。
在儲存時他可以選擇應用的平台(Macintosh、IBMPC),另外也可以選擇不具破壞姓的LZW演算法壓縮圖片資料。
壓縮比例在黑白(Bitonal)模式裡大約是10:
1﹔在灰階(Grayscale)模式裡大約是3~5:
1﹔在全彩(color)模式裡大約是2:
1。
由於壓縮後的TIFF格式圖檔不會使影像失真,又可應用在不同平台、不同軟體上,因此適合作為原始資料的保存圖片(ArchivalImage),以供日後再加工處理(e.g.壓縮、或是加上文字說明)產生其他圖檔格式,或是能提供報章雜誌較高解析度圖片的印刷來源。
不過由於TIFF格式的壓縮的比例不是很高,一個經過LZW壓縮過的灰階TIFF檔也要將近1M,而全彩的TIFF則要2~3M,因此若考量網路頻寬的問題,數位化以後是否提供這類型圖檔格式供使用者下載還需要更詳細的評估。
2.GIF格式
GIF格式只能儲存最多256色的色彩階數,因此其檔案較其他格式小,故適合應用於網路上圖檔的傳輸。
由於最多只能儲存256色,所以在儲存前必須將其圖檔的模式轉換為黑白、灰階或是256彩色,否則無法儲存。
如果原始圖片是彩色的話,則256彩色模式可能無法準確的紀錄原始圖片,因此GIF不適合來作為原始資料的保存圖片(ArchivalImage)。
但如果作為放在網頁上供人預覽用的Thumbnail圖片則是非常適合。
在儲存GIF時可以選擇Interlace(交錯的)儲存格式,讓影像在顯示時展現由模糊逐漸轉為清晰的效果,此外GIF格式也具有壓縮的效果,同樣也是用一種LZW的演算法壓縮資料的。
3.JPEG格式
JPEG格式是一種壓縮效率很高的儲存格式,主要處理灰階和全彩模式的圖檔:
灰階模式(Grayscale)下約為10:
1;全彩模式(color)下約為20:
1。
他和GIF格式不同在於JPEG是採具破壞姓的JPEG壓縮方式,而且可以處理RGB模式下所有的色彩資訊。
在儲存的過程可以決定壓縮的層級,如果選擇高壓縮的方式,則影像的品質會降低(因具破壞性,有些細節部分會遺失造成失真),而低壓縮的方式,會使影像的品質較接近原來的影像圖。
由於JPEG格式會造成影像的失真,因此也不適合作為原始資料的保存圖片(ArchivalImage)。
但也因為他高效率的壓縮方式使得檔案變得很小,因此適合放在網路上供人瀏覽。
4.BMP格式
BMP是Windows小畫家的檔案格式,此格式相容於大多數Windows和OS/2平台的應用程式。
可以儲存1bit(黑白)到24bit(全彩)的RGB色彩階數。
另外BMP在儲存時也可以使用RLE的壓縮格式,不過只有在256色或是16色時才能用此壓縮方式,壓縮效果不是很好,約為2~3:
1。
5.PDF格式
PDF格式使用在AdobeAcrobat這套電子出版軟體中。
這種格式可以應用在Unix、Dos、Macintosh、Windows等不同的平台(AdobeSystem公司提供了在各個平台上的AcrobatReader瀏覽軟體來觀看PDF檔案)。
在儲存PDF圖檔時可以選擇用JPEG或是ZIP格式來進行壓縮。
由於一般的WWW瀏覽器可能無法直接瀏覽此檔案格式,所以不能直接放到網路上供一般的瀏覽器瀏覽。
不過可以考慮製作一系列的PDF檔結合影像跟文字在下傳給使用者透過AcrobatReader來瀏覽這些文件。
6.PNG格式
PNG格式的發展主要是用來取代GIF格式,主要也是應用於Internet及通訊上。
它保存了比GIF更多的色彩資訊,並且可以儲存全彩24bit的影像資料(GIF最多只能儲存8bit的影像資料),另外它也是採用非破壞性的壓縮方式,壓縮效果也比GIF更好一點。
但是由於還未全面支援,許多WWW瀏覽器無法直接瀏覽此種圖檔格式,因此這種檔案格式並未被普遍採用。
7.FlashPix格式
FlashPix是Kodak公司定義的一格式,用來在應用軟體裡快速的轉換及預覽大容量的影像。
在儲存時可以選擇是否使用Jpeg的影像壓縮法,來降低檔案的大小,不過同樣的也會造成某些部分的失真。
8.PCX格式
PCX格式是PCPaintbrush繪圖軟體的檔案格式。
此格式普遍應用在IBMPC相容電腦上,也具備壓縮功能。
9.PICT格式
PICT檔案格式普遍用於Macintosh系統的繪圖軟體與排版軟體上。
此種檔案格式對於面積較大的色塊有極佳的壓縮效果。
各種檔案格式比較
格式
色彩支援
壓縮效果
壓縮失真
瀏覽器支援
適用時機
TIFF
黑白、灰階、全彩
佳
否
否
保存圖片ArchivalImage
GIF
黑白、灰階、256彩色
佳
否
是
網路上預覽
JPEG
灰階、全彩
極佳
是
是
網路上瀏覽
BMP
黑白、灰階、全彩
普通
否
否
保存圖片ArchivalImage
PDF
黑白、灰階、全彩
Jpeg/Zip
極佳/普通
是/否
否
下載
PNG
灰階、全彩
佳
否
是
網路上預覽
FlashPix
灰階、全彩
極佳
是
否
下載
PCX
黑白、灰階、全彩
普通
否
否
保存圖片ArchivalImage
PICT
黑白、灰階、全彩
普通
否
否
保存圖片ArchivalImage
三、LibraryofCongress的做法
在美國國會圖書館AmericanMemory計劃裡,將每一份圖片作成TIFF、GIF、JPEG等三種格式。
其中TIFF檔是用來當作永久的保存圖片ArchivalImage,可能採較高的解析度且不壓縮;GIF則是用來作為網路上預覽用的小圖檔thumbnailImage﹔JPEG則是作為網路上瀏覽的圖片。
四、討論&建議
其他可以作為保存圖片的有格式有BMP、PCX、PICT,其中BMP只有在16或256色時才能用RLE壓縮,且壓縮效果不如LZW演算法來的好。
而PCX和PICT的壓縮效果也不如TIFF。
所以建議使用TIFF作為保存圖片格式並壓縮檔案以節省空間。
LZW演算法不會造成影像的失真,唯一的缺點是開啟和儲存檔案的時間會比較久。
作為預覽圖片的GIF檔只能儲存最多256色的影像資訊,所以必須把全彩24bits的TIFF檔轉換為256彩色會是灰階才能以GIF格式儲存,不過預覽圖片通常都很小因此影響不大。
另外可以考慮使用PNG來作為預覽圖片格式,PNG可以完整儲存全彩24bits色彩資訊且採非破壞性壓縮,不過此格式瀏覽器還未全面支援。
而網路上供人瀏覽的圖片,由於必須考慮檔案大小以及瀏覽器支援的問題,應該還是JPEG格式最為適合
五、可用軟體&做法
1.AdobePhotoshop
Photoshop是一套功能強大的影像處理軟體,透過一台掃描器輸入影像再經過處理就能完成上述的圖片資料。
首先在Photoshop裡執行「File/Import」選擇TWAIN_32Source,接著執行TWAIN_32就能開始使用Scanner。
先掃描原始資料作成保存圖片ArchivalImage,可以選擇較高的解析度300dpi或更高,色彩則可以選擇彩色RGB或是灰階Grayscale。
掃描之後的影像應先以TIFF格式儲存,作為永久保存的ArchivalImage。
接著再用ArchivalImage製作網路瀏覽圖片和預覽圖片。
由於顯示器的解析度一般為75dpi左右,300dpi的影像在螢幕上會變得很大,使用者在瀏覽時必須要拉動捲軸才能看到完整的圖片,相當不方便,因此在轉換成JPEG格式作為瀏覽圖片之前應先將影像大小減少。
執行「Image/ImageSize」就可以調整PixelDimensions。
大約調成500*400~1000*700pixels,如此才能符合一般螢幕的解析度而將整張圖片顯示在螢幕區域內。
至於預覽圖片ThumbnailImage則需調整為更少的像素數目,一般大約為150*100~200~200pixels。
若是要存成GIF檔則須把全彩24bits的影像先轉成256彩色,做法是執行「Image/Mode」選擇IndexedColor,ColorDepth應選擇8bits/pixel;ColorMatching選Best則會得到較佳的影像,但轉換的時間較久。
若原本的ArchivalImage是灰階影像則不需經過上述程序,直接執行「File/SaveAs」選擇GIF格式即可。
若是要存成PNG格式則直接存取,因為PNG支援全彩24bits,不過由於它記錄了更多的色彩資訊,所以檔案大小會稍微大一些。
六、調整明亮度&對比
掃描之後的影像可能因為光反射或是辨色誤差的關係跟原始的影像有些差距,這時可以在Photoshop裡執行「Image/Adjust/Brightness&Contrast」來調整明亮度和對比使影像更為接近原始的圖案。
七、影像修補
在掃描影像時常常會因為一些外在的因素,如灰塵、毛髮、刮痕等使掃描的影像產生缺陷。
在Photoshop裡可以利用Dust&Scratches濾鏡來去除影像中這些雜點。
方法是執行「Filter/Noise/Dust&Scratches」,以雜質在影像中的大小(Radius半徑)和雜質和周圍像素的明亮度差異(Threshold臨界質)來決定是否將雜質(像素)去除。
其他可用的軟體還包括PaintShopPro等,做法上大致相同。
以影像來儲存文字資料
文字資料有時會以影像的方式來儲存,透過現在光學字元辨識OCR的技術,可以相當高的辨識率將影像裡的文字轉換成純文字資料,以方便網路上以文字搜尋。
特別是一些比較現代的印刷文件,辨識率更可以高達95%以上,這樣可以減少許多人工打字的時間。
另一方面,有些諸如手稿、手抄本或是一些珍貴的歷史文件以影像的方式數位化後也可以保存原始資料的質感跟外觀。
不過這類型的文件資料本身較不清楚,透過OCR的辨識率可能比較低。
因此可能需要以人工的方式將影像裡的文字轉成可搜尋的純文字資料。
1.印刷或是打字稿文件
這類型的文件由於較清晰通常可以黑白的模式掃描成圖檔,由黑白模式每個像素僅佔1bit的空間,因此經過LZW壓縮的的TIFF檔已經相當小。
掃描時可以選擇300dpi或是更高,另外將對比值調高。
如此可以獲得較清晰的影像,這對往後的光學辨識OCR正確率有相當大的影響。
另外若要放到網路上供人瀏覽則可以跟前述圖片資料一樣減少像素個數並存成GIF格式。
2.手稿或是珍貴的歷史文件
這類型的文件可能因為長時間的保存,因為紙張的變色,而手稿也可能因為墨水的擴散使得它跟印刷文件有截然不同的形式。
若用黑白的模式來掃描文件的話可能無法完整紀錄文件的外觀跟質感(亮度、陰暗部分、顏色)。
因此要用灰階或是全彩的模式來掃描才能比較正確地reproduce這類型的文件。
做法跟上述圖片資料大致一樣,也可以利用Photoshop的濾鏡效果去除掃描過程因為灰塵、刮痕、毛髮等因素所產生的雜色。
聲音資料數位化相關標準
(一)WAVE檔:
全名為“RIFFWAVE”(RIFF=RASTERIMAGEFILEFORMAT光柵影像檔案格式)。
是聲音的原始資料檔。
一般在錄音帶或CD中的音軌皆為此一格式。
錄音帶中的資料可以透過音效卡的LINEIN功能儲存到電腦裡;而CD中的音軌則可以透過抓取音軌的程式,如:
WINDAC加以擷取。
WAVE檔最大的好處是原音保存,但是,相對的,它所需要的空間就很大,一般而言,一分鐘的WAVE檔案約要10MB的儲存空間。
(二)MP3檔:
全名為“MPEGAUDIOLAYER3”,是一種高壓縮率的音樂檔案格式。
一般而言,採用立體音效的組態設定時,壓縮率可以達到1:
12。
再加上保真度高(OR失真率低)。
換言之,MP3檔的音效品質與CD相近,所以,這種音樂資料轉換方式相當流行。
(三)RA檔:
全名為“THEREALAUDIOSTREAMINGAUDIOFORMAT”。
這是一種能夠支援網路播放的檔案格式;當RA檔在下載的同時,它就可以直接播放,而不用等到全部下載完畢在播放。
然而,網路品質的好壞為其播放順暢與否的關鍵。
三種檔案格式的比較
資料格式
簡介
優點
缺點
製作軟體
Wave檔
聲音檔案的原始格式,主要是從CD或錄音帶直接轉換而來。
1.原音呈現
1.佔空間(1分鐘的WAVE檔約要10B的空間)
WinDAC
mp3檔
聲音檔的壓縮格式之一
1.壓縮率高(約為原來的12分之一)
1.某種程度的失真
Mplifer
mp3compressor
RA檔
REALAUDIO的檔案格式
提供線上播放的功能
如果網路品質不好,則使用起來效果很差
Raencoder
視訊資料數位化相關標準
視訊資料是以每秒播放幾個好幾張圖片frame並結合聲音所構成,所以檔案相當佔空間。
影像的品質通常由解析度和每秒播放多少個frame來決定,以及壓縮的方式來決定。
一般人的視覺通常要到每秒播放30個frames以上才不會感覺畫面有跳動的情形。
一、視訊資料數位化相關標準
1.AVI格式
AVI格式是Microsoft支援在windows底下播放的動態影像格式,主要是提供較低階的桌上型電腦來播放。
但AVI格式的畫值跟壓縮比例都不是很理想,最多為15frames/sec,單音,1/4個螢幕。
不過在windows底下不需要任何而外的軟體就能播放。
2.QuickTime格式
QuickTime是Apple公司為Macintosh系統制定的動態影像格式,可以在各種平台上透過Plug-in來播放。
同樣是提供較低階的電腦來播放。
3.MPEG格式
MPEG格式是ISO國際標準協會制定的動態影像與聲音的壓縮編碼格式。
目前主要有MPEG-1、MPEG-2以及正在發展中的MPEG-4。
MPEG-1主要是提供一班傳輸速率的頻道來播放影像和聲音(約為1,5bits/sec),如一般的光碟機。
MPEG-1在解析度352*240,傳輸速率30frames/secNTSC的系統裡很好的表現。
MPEG-1是現在最普遍的格式,它的好處是提供極高的壓縮比例,同時保有相對avi格式來說更好的畫值。
MPEG-1可以透過硬體或是軟體來編碼解碼,現在一般pentium133等級以上的平台電腦都可以透過軟體來播放MPEG-1格式的視訊檔。
MPEG-2則是提供更高的解析度支援以及較高的bitrate(3~10Mbits/sec)來播放高畫值的影像,主要是提供有線電視業者播放高