授業科目名(和文)
[Course]
言語工学
授業科目名(英文)
[Course]
Natural Language Engineering
学部(研究科)
[Faculty]
情報系工学研究科
学科(専攻)
[Department]
機械情報システム工学専攻
担当教員(○:代表教員)
[Principle Instructor(○)
and Instructors]
○菊井 玄一郎  自室番号(2606)、電子メール(kikui**cse.oka-pu.ac.jp)
※利用の際は,** を @に置き換えてください
単位数
[Point(Credit)]
2単位
対象学生
[Eligible students]
1,2年次生
授業概略と目標
[Course description and Objects]
人間が思考したりコミュニケーションしたりする上で「ことば」は最も基本的な手段である.この言語を工学的に扱うための基本的な考え方と手法について学ぶ.
講義では,日本語を対象として文の構造や意味を解析する処理の流れと要素技術(形態素解析、構文解析/係り受け解析,辞書)について学ぶ.また,これらを計算機で実装するために必要な文字コードや文字列処理についても学習する.講義では人間のことばを計算機で扱うことの面白さ・意義と現在の手法の限界について理解を深める。
到達目標
[Learning Goal]
1.自然言語処理の流れと技術の体系を理解する
2.文字列処理(文字コード,文字化け,検索,辞書引き)について理解する.
3.自然言語解析(形態素解析,係り受け,意味解析)の概要と手法について理解する.
履修上の注意
[Notes]
特になし
授業計画とスケジュール
[Course schedule]
1. 概論,文字コード1:自然言語処理の目的と構成要素,計算機で文字を扱うには?
2. 文字コード2 :文字集合と符号化法,utf-8
3. 形態素解析1:形態素解析とは?処理の概要,既存ソフト
4. 形態素解析2:辞書検索1(ハッシュ,トライ,ダブル配列の検索)
5. 形態素解析3:辞書検索2(ダブル配列の構築)
6. 形態素解析4:最適解の探索(形態素ラティスとコスト最小法)
7. 形態素解析5:正解から学習する(マルコフモデル)
8. かな漢字変換とn-best探索
9. 自然言語の統計的性質:コーパス,単語の頻度分布,エントロピー
10. 固有表現抽出
11. 係り受け解析1:係り受け解析とは?文節切り,係り先決定の基礎
12. 係り受け解析2:統計的係り受け解析
13. 意味解析1(述語項構造解析):係り受け解析との違い.
14. 意味解析2(統計的な意味の扱い)
15. まとめ,関連領域との関係
成績評価方法と基準
[Grading policy (Evaluation)]
授業中に出すレポート課題と授業態度(発言)により評価する.
教科書
[Textbook]
教科書:なし(スライド資料を配布する)
スライド等の資料は http://iis.cse.oka-pu.ac.jp/courses/nle/ で公開(アクセス制限あり)
参考書:奥村学著,自然言語処理の基礎,コロナ社,
高村大也著,言語処理のための機械学習入門,コロナ社,など.
自主学習ガイド及び
キーワード
[Self learning]
紹介したアルゴリズムをスクリプト言語などで実装すると理解が深まる。
開講年度
[Year of the course]
25