授業科目名(和文) [Course] |
言語工学 |
授業科目名(英文) [Course] |
Natural Language Engineering |
学部(研究科) [Faculty] |
情報系工学研究科 |
学科(専攻) [Department] |
システム工学専攻前期 |
担当教員(○:代表教員) [Principle Instructor(○) and Instructors] |
○菊井 玄一郎 自室番号(2606)、電子メール(kikui**cse.oka-pu.ac.jp) ※利用の際は,** を @に置き換えてください |
単位数 [Point(Credit)] |
2単位 |
対象学生 [Eligible students] |
1・2年次生 後期 |
授業概略と目標 [Course description and Objects] |
人間が思考したりコミュニケーションしたりする上で「ことば」は最も基本的な手段である.この言語を工学的に扱うための基本的な考え方と手法について学ぶ. 講義では,日本語を対象として文の構造や意味を解析する処理の流れと要素技術(形態素解析、構文解析/係り受け解析,辞書)について学ぶ.また,これらを計算機で実装するために必要な文字コードや文字列処理についても学習する.講義では人間のことばを計算機で扱うことの面白さ・意義と現在の手法の限界について理解を深める。 |
到達目標 [Learning Goal] |
1.自然言語処理の流れと技術の体系を理解する 2.文字列処理(文字コード,文字化け,検索,辞書引き)について理解する. 3.自然言語解析(形態素解析,係り受け,意味解析)の概要と手法について理解する. |
履修上の注意 [Notes] |
特になし |
授業計画とスケジュール [Course schedule] |
1. 概論,文字コード1:自然言語処理の目的と構成要素,計算機で文字を扱うには? ・概要を説明したあと,計算機内部でどのように言語データが表現されるかを考える 2. 文字コード2 :文字集合と符号化法,utf-8 ・言語データを計算機で表す具体的な方法について理解する 3. 形態素解析1:形態素解析とは?処理の概要,既存ソフト ・形態素解析処理の役割と機能,処理の基本的な流れについて理解する 4. 形態素解析2:辞書検索1(トライ) ・ハッシュについて復習したあとトライ構造について理解する 5. 形態素解析3:辞書検索2(ダブル配列の検索と構築) ・形態素解析における実用的な辞書構造としてダブル配列がある.この手法を理解する. 6. 形態素解析4:最適解の探索(形態素ラティスとコスト最小法) ・形態素解析を最小コスト経路の探索とみなす方法について説明する 7. 形態素解析5:正解から学習する(マルコフモデル) ・コスト最小法の各パラメータを統計データから学習する方法について述べる. 8. 形態素解析6:n-best探索 ・最適候補だけでなく上位n個の候補を効率的に出力する方法について学ぶ 9. 形態素解析7:その他の方法(CRF) ・統計的な手法のうち精度が高いことで知られるCRFを理解する 10.自然言語の統計的性質:コーパス,単語の頻度分布,エントロピー 11. 係り受け解析1:係り受け解析とは?文節切り,係り先決定の基礎 ・日本語の構文構造として良く用いられている「文節係り受け構造」を 推定する方法を理解する 12. 係り受け解析2:統計的係り受け解析 ・文節係り受け構造への解析を機械学習によって行う方法を学ぶ 13. 意味解析1(述語項構造解析):係り受け解析との違い. ・意味構造の基本である「述語・項構造(predicate argument structure)」がどういうものか,また, それと併用が必要なモダリティ,時制等について考える 14. 意味解析2(統計的な意味の扱い) 15. まとめ,関連領域との関係 |
成績評価方法と基準 [Grading policy (Evaluation)] |
レポート課題(80%)と受講態度(積極性)(20%)により総合的に評価する. |
教科書 [Textbook] |
教科書:なし(スライド資料を配布する) スライド等の資料は http://iis.cse.oka-pu.ac.jp/courses/nle/ で公開(アクセス制限あり) 参考書: 黒橋禎夫著,自然言語処理NHK出版, 奥村学著,自然言語処理の基礎,コロナ社, |
自主学習ガイド及び キーワード [Self learning] |
紹介したアルゴリズムをスクリプト言語などで実装すると理解が深まる。 |
開講年度 [Year of the course] |
28 |