版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、伴隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)一步普及,國(guó)民信息技術(shù)應(yīng)用能力作為發(fā)展的重難點(diǎn)而被特別強(qiáng)調(diào),提高國(guó)民信息技術(shù)能力是教育技術(shù)學(xué)科建設(shè)的重點(diǎn)之一。
Flash動(dòng)畫(huà)作為一種集文本、圖形、圖像、聲音、視頻、動(dòng)畫(huà)于一身的多媒體載體,憑借其制作簡(jiǎn)單、矢量格式放大不失真、體積小、交互豐富等特點(diǎn)日漸得到廣泛的應(yīng)用。
Flash動(dòng)畫(huà)資源日益重要,但是獲取Flash動(dòng)畫(huà)資源的檢索研究還相對(duì)滯后。數(shù)據(jù)顯示關(guān)鍵詞檢索的方式依然是互聯(lián)網(wǎng)用戶檢索資源時(shí)使用
2、的主要的手段。當(dāng)前的Flash動(dòng)畫(huà)資源關(guān)鍵詞檢索是指針對(duì)資源所在網(wǎng)頁(yè)進(jìn)行分析,提取網(wǎng)頁(yè)中的相關(guān)文本,分析得到的文本建立文本索引,這種方法有著明顯的缺陷,主要是由于網(wǎng)頁(yè)中的相關(guān)文本并不能很好的描述Flash動(dòng)畫(huà)的內(nèi)容,造成了檢索中的諸多問(wèn)題。
本研究立題網(wǎng)絡(luò)Flash資源文本信息提取,主要研究?jī)?nèi)容為: Flash動(dòng)畫(huà)文件的結(jié)構(gòu)和形成運(yùn)作方式; Flash動(dòng)畫(huà)內(nèi)部的文本信息的存在形式;Flash動(dòng)畫(huà)內(nèi)部文本信息提取方法;Flash
3、動(dòng)畫(huà)內(nèi)部的文本信息的中文分詞技術(shù);設(shè)計(jì)相應(yīng)的數(shù)據(jù)庫(kù)收錄分析得到的關(guān)鍵詞形成索引。
首先,充分研究了網(wǎng)絡(luò)Flash動(dòng)畫(huà)文件中各類標(biāo)簽的結(jié)構(gòu)內(nèi)容和主要功能,通過(guò)研究標(biāo)簽了解Flash動(dòng)畫(huà)的運(yùn)行方式和形成過(guò)程。網(wǎng)絡(luò)中Flash動(dòng)畫(huà)文件的主要格式為SWF,是一種與 XML文件結(jié)構(gòu)相似的文件格式。Flash動(dòng)畫(huà)中所包含的各種媒體元素、視覺(jué)效果以及交互的實(shí)現(xiàn)都是依靠一套獨(dú)立的二進(jìn)制標(biāo)簽進(jìn)行說(shuō)明的。
然后,研究Flash動(dòng)畫(huà)中文本
4、信息分類并提出相應(yīng)的提取方法。在充分分析Flash動(dòng)畫(huà)文件文本的定義方式、存儲(chǔ)結(jié)構(gòu)的基礎(chǔ)上,依照其定義、結(jié)構(gòu)、存儲(chǔ)方式的的不同將Flash動(dòng)畫(huà)中的文本信息分為不同種類,即靜態(tài)文本和動(dòng)態(tài)文本、輸入文本。又按照其定義的方式不同進(jìn)一步細(xì)分為輪廓文本和設(shè)備文本,針對(duì)不同種類文本的存儲(chǔ)特點(diǎn)找到不同的提取方式。
接著,研究了Flash動(dòng)畫(huà)文本信息中文分詞技術(shù)。在對(duì)中文分詞技術(shù)進(jìn)行大量研究工作之后,提出本研究的分詞技術(shù),將提取到的字符串在經(jīng)
5、歷一系列的轉(zhuǎn)碼工作之后得到漢字字串,漢字字串通過(guò)基于詞典、雙向比較、詞性標(biāo)注統(tǒng)一的機(jī)械分詞法進(jìn)行分詞處理,得到關(guān)鍵詞之后對(duì)其進(jìn)行進(jìn)一步的過(guò)濾去重,以及劃分處理。并將得到的關(guān)鍵詞存儲(chǔ)至設(shè)計(jì)好的索引數(shù)據(jù)庫(kù)中。
最后,研究檢驗(yàn)系統(tǒng)的性能。以碩思精靈為標(biāo)準(zhǔn)參照,對(duì)七類Flash動(dòng)畫(huà)樣本進(jìn)行檢驗(yàn),從查全率和查準(zhǔn)率兩個(gè)緯度對(duì)系統(tǒng)的性能進(jìn)行檢驗(yàn)。
本論文使用的開(kāi)發(fā)工具為Visual C++6.0程序,在Windows XP操作系統(tǒng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Web中多媒體資源分析與文本信息提取研究.pdf
- 彩色圖像的文本信息提取研究.pdf
- 中文病歷文本的時(shí)間信息提取研究.pdf
- 視頻中文本信息提取技術(shù)研究.pdf
- 自然場(chǎng)景中文本信息提取方法.pdf
- 網(wǎng)絡(luò)信息提取與分析技術(shù).pdf
- 自然場(chǎng)景文本信息提取關(guān)鍵技術(shù)研究.pdf
- 網(wǎng)絡(luò)課件的多粒度信息提取.pdf
- 基于條件隨機(jī)域模型的文本信息提取.pdf
- 文本分類與信息提取方法的研究與設(shè)計(jì).pdf
- 基于復(fù)雜網(wǎng)絡(luò)抗毀性的信息提取研究.pdf
- 基于策略的網(wǎng)絡(luò)信息提取技術(shù)的研究.pdf
- 基于小波變換的圖像文本信息提取算法.pdf
- 多格式文檔文本信息提取及分析技術(shù)研究與實(shí)現(xiàn).pdf
- 10793.面向web文本的滑坡災(zāi)害信息提取技術(shù)研究
- 中考語(yǔ)文信息提取
- Internet上的信息提取.pdf
- Web視頻信息提取研究.pdf
- 視頻語(yǔ)義信息提取的研究.pdf
- 視頻圖像語(yǔ)義信息提取研究.pdf
評(píng)論
0/150
提交評(píng)論