大學(xué)畢業(yè)論文設(shè)計計算機專業(yè)
《大學(xué)畢業(yè)論文設(shè)計計算機專業(yè)》由會員分享,可在線閱讀,更多相關(guān)《大學(xué)畢業(yè)論文設(shè)計計算機專業(yè)(16頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、word 畢 業(yè) 論 文 論文題目: 姓 名: 學(xué) 號: 學(xué)習(xí)中心: 專 業(yè): 指導(dǎo)教師: 二〇〇 年 月 畢業(yè)論文承諾書 提示:根據(jù)語言大學(xué)網(wǎng)絡(luò)教育學(xué)院論文寫作的規(guī)定,如發(fā)現(xiàn)論文有抄襲、網(wǎng)上下載、請人代寫等情況,畢業(yè)論文一律不與格。同時取消學(xué)士學(xué)位申請資格。畢業(yè)論文不與格者,可申請重寫一次,并按重修繳納費用。 本人承諾:本人已經(jīng)了解語言大學(xué)的畢業(yè)論文寫作的有關(guān)規(guī)定;本人的論文是在指導(dǎo)教師指導(dǎo)下獨立完成的研究成果。整篇論文除了文中已注明出處或引用的內(nèi)容外,
2、絕沒有侵犯他人知識產(chǎn)權(quán)。對本論文所涉與的研究工作做出貢獻(xiàn)的個人和集體,均已在文中以明確方式注明。 簽 名:_____________ 日 期:________________ 目 錄 目錄2 摘要2 Abstract3 第一章緒論1 1.1 前言1 1.2 研究背景1 信息抽取概述1 基于內(nèi)容的文本信息提取2 1.3開發(fā)人機交互的標(biāo)注工具的意義3 1.4任務(wù)描述3 1.5論文的組織和安排3 第二章標(biāo)注工具的設(shè)計原如此和設(shè)計思想5 2.1研究方法和指導(dǎo)思想5 2.2標(biāo)注工具的設(shè)計原如此5 2
3、.2.2 文本標(biāo)注工具的設(shè)計原如此5 2.3 人機交互界面設(shè)計原如此5 第三章標(biāo)注工具的具體開發(fā)5 3.1開發(fā)環(huán)境的選擇5 3.2標(biāo)注工具的設(shè)計5 標(biāo)注工具的界面算法5 結(jié)構(gòu)設(shè)計5 3.3 標(biāo)注工具的詳細(xì)設(shè)計6 人機交互界面詳細(xì)設(shè)計6 菜單和工具欄的設(shè)計6 3.4標(biāo)注過程文本的處理6 實體標(biāo)注詳細(xì)設(shè)計6 關(guān)系標(biāo)注詳細(xì)設(shè)計6 事件標(biāo)注詳細(xì)設(shè)計6 3.5 標(biāo)注結(jié)果6 3.6技術(shù)難點討論6 第四章標(biāo)注工具的缺陷分析和功能展望7 完畢語2 致謝2 參考文獻(xiàn)2 4 / 16 人機交互文本標(biāo)注工具開發(fā) ***
4、 指導(dǎo)教師:*****〔指導(dǎo)教師職稱〕 摘要:基于內(nèi)容的文本信息提取是當(dāng)前的一個研究熱點,無論搜索引擎還是問答系統(tǒng),其根本的根底是有效的獲取文本中的信息。使用機器學(xué)習(xí)的方法從語料庫中獲取有效的知識,以支持文本信息的處理已經(jīng)成為計算語言學(xué)的一個主流技術(shù),而帶標(biāo)語料庫如此是這一技術(shù)的根底。 帶標(biāo)語料庫的建設(shè)的根底就是對大量的文本進展標(biāo)注,并以一定的結(jié)構(gòu)來存儲。這樣一來就需要開發(fā)一個具有友好的人機交互界面的文本標(biāo)注工具來輔助文本標(biāo)注,在一定程序上減輕標(biāo)注工作者的負(fù)擔(dān)。 這次文本標(biāo)注工具的設(shè)計,處理的目標(biāo)是純文本文件,以一篇文檔為單位提供用戶進展實體,事件,關(guān)系的標(biāo)注,并在標(biāo)注過程中給出標(biāo)
5、注的中間結(jié)果,最后在保存標(biāo)注文件的時候進展處理,以xml語言格式進展輸出存儲。標(biāo)注工具的功能包括對文本的實體,事件,關(guān)系三大類的標(biāo)注,對標(biāo)注過的文本進展標(biāo)記,提醒用戶標(biāo)注進度,最后對標(biāo)注中間結(jié)果的處理與保存。 本文是對這次人機交互文本標(biāo)注工具的設(shè)計與實現(xiàn)的詳細(xì)的闡述。首先對背景與理論知識作了具體的介紹。然后,分別進展文本標(biāo)注工具的系統(tǒng)分析、總體架構(gòu)分析,并對每個模塊的具體實現(xiàn)做詳細(xì)地講解。最后,本文還介紹本次文本標(biāo)注工具設(shè)計的缺陷以與未來改良的方案,并對本次標(biāo)注工具的開發(fā)作總結(jié)。 關(guān)鍵詞: 人機交互,文本標(biāo)注,MFC編程 The Interactive Text
6、tagging Tool Development Author: ***** Tutor: ***** Abstract:The text information extration based on content is a current study hotspot. Regardless of the search engine or the interrogator-responder system, their basic foundation is gain text information in effective. Use the method of mac
7、hine learning to gains the effective knowledge from Corpus , supporting the text information processing is already bee putaional linguisticsa mainstream technology. The tagged corpus is the technical foundation. The target of this text tagging tool design is the processed corpora(text). Taking th
8、e single piece of text for users to tag entities, relations, events, and show intermediate results during tagging process . culminating in the preservation of tagging documents processed xml language to the output format for storage. The tool's functional annotation including tagging the entities, t
9、he events, the relations labeled the tagging off text , remind users the tagging progress, and dealing the intermediate results processing and preservation. The paper will describe and discuss over the design and realization of this interactive text tagging tool. Firstly, detailed theoretical ba
10、ckgrounds will be given; secondly, analysis of this tool and general structure for it and the full descriptions about the realization of each model will be introduced; finally, the defects of the design of the tool and improvement to its future development will be given and a summary of the structur
11、e and the performance of the system will be delivered as well. Key word:Human puterInteractive, Text tagging, MFC 第一章 緒 論 1.1 前言 隨著互聯(lián)網(wǎng)的廣泛普與,語言信息處理的社會需求越來越大,人們迫切需要用自動化的手段處理海量的語言信息。語言資源有計劃有規(guī)模的開發(fā)對于語言信息處理領(lǐng)域的研究和開發(fā)具有重要意義。 對文本進展標(biāo)注就是語言資源建設(shè)的一個方面,人機交互式的標(biāo)注工具是進展語料標(biāo)注的有效手段,從一定程度上可以的減輕標(biāo)注工作者的負(fù)擔(dān),同時還
12、可以輔助檢查標(biāo)注結(jié)果。 開發(fā)界面友好的標(biāo)注工具可以進一步的提高標(biāo)注工作者的效率,同時結(jié)構(gòu)化的輸出更方便標(biāo)注數(shù)據(jù)的后續(xù)使用。 1.2 研究背景 信息抽取概述 信息抽取是指從一段文本中抽取指定的事件,事實等信息,形成結(jié)構(gòu)化的數(shù)據(jù)并填入一個數(shù)據(jù)庫中供用戶查詢使用的過程。即它從文本中抽取用戶感興趣的事件,實體和關(guān)系,被抽取出來的信息以結(jié)構(gòu)化的形式描述,然后存儲在數(shù)據(jù)庫中,為情報分析和監(jiān)測、比價購物、自動文摘、文本分類等各種應(yīng)用提供服務(wù)。 例如,災(zāi)害預(yù)防部門可以從自然災(zāi)害的新聞報道中抽取出災(zāi)害的類型、時間、地點、人員傷亡、經(jīng)濟損失等情況;醫(yī)生可以從病人的醫(yī)療記錄中抽取出癥狀、診斷記錄和檢
13、驗結(jié)果;安全部門分析有線新聞和廣播電視的文本來找到和總結(jié)恐怖分子活動記錄等。 一般來說,信息抽取系統(tǒng)的處理對象是自然語言文本尤其是非結(jié)構(gòu)化文本。但廣義上講,除了電子文本以外,信息抽取系統(tǒng)的處理對象還可以是語音、圖像、視頻等其他媒體類型的數(shù)據(jù)。 基于內(nèi)容的文本信息提取 基于內(nèi)容的文本信息提取是當(dāng)前的一個研究熱點,無論搜索引擎還是問答系統(tǒng),其根本的根底是有效的獲取文本中的信息。使用機器學(xué)習(xí)的方法從語料庫中獲取有效的知識,以支持文本信息的處理已經(jīng)成為計算語言學(xué)的一個主流技術(shù),而帶標(biāo)語料庫如此是這一技術(shù)的根底。 由于語言本身的復(fù)雜性和富含信息的特點,使得語料庫標(biāo)注的內(nèi)容、對象可以在語法、語
14、義、語用等各個層次上進展,語料庫標(biāo)注的內(nèi)容和程度,從根本上決定了從文本中可以提取出的信息內(nèi)容和信息粒度,也決定了進展文本內(nèi)容計算的對象、方法。比如,對于文本片斷, 據(jù)美國加利福尼亞州羅斯維爾市警方說,一架單引擎飛機12日在羅斯維爾市郊墜毀,機上2人全部死亡,被飛機撞毀的一座房屋中2人失蹤。 其中所包含的信息有:飛機墜毀的時間〔12日〕、地點〔羅斯維爾市郊〕、傷亡情況〔2人死亡,2人失蹤〕、該消息的來源〔警方〕、飛機本身的狀態(tài)屬性〔單引擎〕、消息來源的屬性〔美國加利福尼亞州羅斯維爾市警方〕、死亡人員的屬性(機上2人)、失蹤人員的屬性〔被飛機撞毀的一座房屋中2人〕、……。 這些信息直接反映了
15、文本片斷的意義,包括了命名實體、實體〔如“羅斯維爾市〞、“飛機〞〕;實體的屬性與其間的關(guān)系〔如“羅斯維爾市警方〞與“警方〞,失蹤人員和房屋的關(guān)系〕;事件〔如“墜毀〞事件〕與其屬性〔事件的時間、地點、傷亡情況等〕。表達(dá)這些信息的語言形式是豐富多樣的,我們將其稱為意義單元。因此,有效地標(biāo)注文本中的意義單元,是面向文本內(nèi)容計算進展資源建設(shè)的一個嘗試。 根據(jù)突發(fā)事件的類型,對真實文本中意義單元的屬性、特征、相關(guān)連方式進展研究,并通過標(biāo)注體系將其表現(xiàn)出來,是前人沒有做過的。從真實文本的實際數(shù)據(jù)出發(fā),探索支持文本內(nèi)容計算、具有意義信息標(biāo)注的語料庫建設(shè)是一個新的嘗試。 目前,面向文本信息提取的帶標(biāo)語料庫
16、的研究,ACE項目進展的較為深入。ACE對語料庫標(biāo)注形式、方法、內(nèi)容、對象都作了大量的研究,其標(biāo)注內(nèi)容包括文本中的實體表達(dá)、實體間的關(guān)系表達(dá)、事件的表達(dá)等。本文受ACE標(biāo)注內(nèi)容的啟發(fā),通過對ACE已標(biāo)數(shù)據(jù)的分析,確定了以意義單元作為標(biāo)注對象,期望在標(biāo)注內(nèi)容上更加精煉,標(biāo)注的語言層次上能夠貫穿各個層級,同時面對不同的事件信息,能有更準(zhǔn)確的表達(dá)形式。此外,從資源建設(shè)的角度來看,我們必須建設(shè)我們自己的語料庫。 1.3開發(fā)人機交互的標(biāo)注工具的意義 目前語料加工的方式主要有三種方式,即人工、自動、和人機結(jié)合的半自動方式。由于自然語言處理技術(shù)的限制,自動加工方式會給語料庫標(biāo)注帶來一些錯誤,而人工加
17、工方式非常昂貴,需要大量的人力資源。相比之下,半自動加工方式如此兼顧兩者的優(yōu)點。人機結(jié)合的方式有兩種:一種是計算機自動選擇語料庫中需要人工干預(yù)的自動加工方式不能解決的局部,從而減少人的工作;另一種反是如此實現(xiàn)由計算機對加工的語料進展自動加工,然后由人工校對。 對文本進展標(biāo)注就是語言資源建設(shè)的一個方面。人工標(biāo)注的過程是一個艱辛的、費時費力的,然而從語言信息處理開展的觀點來看,是一個必須進展的過程。h"_L%} ` V/Y pz 因此開發(fā)一個可以輔助標(biāo)注工作的工具就有它的意義。 人機交互式的標(biāo)注工具是進展語料標(biāo)注的有效手段,從一定程度上可以的減輕標(biāo)注工作者的負(fù)擔(dān),同時還可以輔助檢查標(biāo)注
18、結(jié)果的一致性等問題。 開發(fā)界面友好的標(biāo)注工具可以進一步的提高標(biāo)注工作者的效率,同時結(jié)構(gòu)化的輸出更方便標(biāo)注數(shù)據(jù)的后續(xù)使用。 1.4任務(wù)描述 本次標(biāo)注工具開發(fā)的主要工作是windows風(fēng)格的交互環(huán)境設(shè)計與實現(xiàn)和適用于文本成分的標(biāo)注風(fēng)格的設(shè)計與實現(xiàn)。具體就是要完成以下的這些任務(wù): A. 人機交互界面的設(shè)計 B. 人機交互界面的實現(xiàn) C. 實體,關(guān)系,實現(xiàn)具體標(biāo)注的實現(xiàn) D. 標(biāo)注中間結(jié)果的顯示 E. 標(biāo)注結(jié)果的結(jié)構(gòu)化輸出 1.5論文的組織和安排 整個論文分為四個局部,緒論介紹了這個標(biāo)注工具出現(xiàn)的背景,解釋了我們構(gòu)造這個工具的必要性,后面各章節(jié)全部圍繞標(biāo)注工具設(shè)計開發(fā)的各
19、個細(xì)節(jié)來描述。分別為 第2章標(biāo)注工具的設(shè)計原如此和設(shè)計思想,包括用戶的各種需求和工具要具備的功能,預(yù)先估計工具開發(fā)過程中可能會遇到的困難,為工具的具體開發(fā)和實現(xiàn)打好根底。 第3章標(biāo)注工具的具體開發(fā),包括開發(fā)環(huán)境的選擇,設(shè)計思想的詳細(xì)實現(xiàn),技術(shù)難點的分析討論。 第4章對這次標(biāo)注工具開發(fā)的總結(jié),分析工具的缺陷以與沒有解決的問題,以與對系統(tǒng)以后改良開展的看法。 第二章 標(biāo)注工具的設(shè)計原如此和設(shè)計思想 2.1研究方法和指導(dǎo)思想 …… 2.2標(biāo)注工具的設(shè)計原如此 …… 2.2.2 文本標(biāo)注工具的設(shè)計原如此 …… 2.3 人機交互界面設(shè)計原如此 …… 第三章 標(biāo)注工具的具體開
20、發(fā) 3.1開發(fā)環(huán)境的選擇 …… 3.2標(biāo)注工具的設(shè)計 ?…… …… 3.3 標(biāo)注工具的詳細(xì)設(shè)計 …… …… 3.4標(biāo)注過程文本的處理 …… …… …… …… 3.5 標(biāo)注結(jié)果 …… 3.6技術(shù)難點討論 …… 第四章 標(biāo)注工具的缺陷分析和功能展望 盡管工具經(jīng)過反復(fù)的設(shè)計和考慮,性能進展盡可能的優(yōu)化,但是本次的標(biāo)注工具的缺陷還是非常多的,由于時間的緊X和能力的有限,還有許多的功能可以去實現(xiàn),還有許多的地方需要改良。 本次標(biāo)注工具實現(xiàn)了簡單的人機交互環(huán)境,但還有許多需要處理的過程。如用戶標(biāo)注之后發(fā)現(xiàn)標(biāo)注出錯撤銷標(biāo)注的操作,標(biāo)注過
21、程中的一些用戶提示和交互。 標(biāo)注中間結(jié)果的處理,如對標(biāo)注中間結(jié)果按標(biāo)注內(nèi)容在原始文本中的位置排序的實現(xiàn)。 完畢語 本論文工作實現(xiàn)了三個功能模塊: 1.標(biāo)注模塊:標(biāo)注模塊實現(xiàn)文本的實體、關(guān)系、事件三局部的標(biāo)注。這個模塊要主要是對文本進展處理,文本的選擇,光標(biāo)在文本中的位置,文本的獲得,文本位置的比擬等等。 2.菜單模塊:根據(jù)用戶標(biāo)注的需要,設(shè)計上下文菜單來實現(xiàn)功能。用戶通過使用上下文菜單來進展標(biāo)注工作。 3.用戶界面模塊:提供用戶良好的界面環(huán)境和輸入環(huán)境,這次標(biāo)注工具的界面由兩個窗口組成,方便用戶對照標(biāo)注
22、結(jié)果進展標(biāo)注。 雖然完成了論文預(yù)定目標(biāo),但是在人機交互上的處理上還有待進一步完善。 致謝 這次畢業(yè)設(shè)計是在楊爾弘教師的熱心指導(dǎo)下才能夠得以完成的。首先感謝她對我學(xué)習(xí)上的教育和幫助。在這次畢業(yè)設(shè)計中,我屢次在交互界面的設(shè)計和文本信息處理上和楊教師進展深入的討論。由于這次設(shè)計周期很長,楊教師一直是耐心的等待我的設(shè)計和測試的結(jié)果。 再者要感謝這大學(xué)四年來在生活和學(xué)習(xí)上幫助我的院系教師,是他們教授的本領(lǐng)陪伴我度過了這充實的大學(xué)生活。我在這四年中的收獲也是很大的。綜合素質(zhì)有很大的提高,這和教師們的關(guān)心教誨是分不開的。 最后感謝與我一起
23、共度四年的同學(xué)們,是我們的互相幫助讓我們一起成長,一起進步,最終順利的畢業(yè)。 參考文獻(xiàn) [1] Jeff Prosise著《MFC Windows 程序設(shè)計》 :清華大學(xué) 2002年2月 [2] X阿奇 主編 《Visual C++ 使用教程第二版》:電子工業(yè) 2003年8月 [3] 朱巧明 李培峰 吳嫻 朱曉旭 等主編 《中文信息處理技術(shù)教程》 :清華大學(xué) 2005年9月 [4] 方可燕 主編 《Visual C++ 6.0實戰(zhàn)與精通》 :清華大學(xué) [5] 查閱了CRichEditView類中相關(guān)函數(shù)的用法 [6] .ergo.???查閱了關(guān)于“軟件人機界面設(shè)計〞的技術(shù)文章以與“設(shè)計為人〞的關(guān)于界面設(shè)計的文章
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《有機化合物的合成》
- 某知名化妝品公司各部門職責(zé)
- 八年級數(shù)學(xué)上冊 第13章 全等三角形 13.4 三角形的尺規(guī)作圖優(yōu)質(zhì)課件 (新版)冀教版
- 化學(xué)九上人教版第六單元課題3第1課時
- 長春版小學(xué)五年級下《桂林山水甲天下》
- 現(xiàn)代社會更需要通才-攻辯
- 海底兩萬里(康塞爾)
- 客戶經(jīng)理積分考核介紹
- 現(xiàn)代教育技術(shù)培訓(xùn)
- 混凝土預(yù)制樁、鋼樁施工
- 氨基酸類藥物
- 威尼斯建筑與藝術(shù)雙年展掠影
- 地產(chǎn)營銷操作手冊課件
- 15機械的效率和自鎖222
- 建筑施工事故案例分析