北京思科源企业管理咨询有限公司

客户热线:010-60190761

自然语言处理NLP入门及进阶大纲

课程时长:3天

应用领域

  机器翻译Machine Translation、信息检索Information Retrieval、自动文摘Automatic summarization/abstracting、文档分类Document Categorization、问答系统Question-answering system、信息过滤Information filtering、语言教学Language Teaching、文字识别Character Recognition、自动校对Automatic Proofreading、语音识别Speech recognition

形式语言与自动机

  ① 形式语法:4元组

  ② 最左推导、最右推导和规范推导

  ③ 句型与句子

  ④ 正则文法

  ⑤ 上下文无关文法CFG

  ⑥ 上下文有关文法CSG

  ⑦ 确定的有限自动机DFA

  ⑧ 不确定的有限自动机NFA

语料库语言学

  ① 国内语料库:汉语现代文学作品语料库、现代汉语语料库、中学语文教材语料库、现代汉语词频统计语料库

  ② 布朗语料库、LLC口语语料库、朗文语料库、宾州大学语料库、北京大学语料库、台湾中科院平衡语料库、Chinese LDC、LC-STAR项目

  ③ 抽取词汇、标注词性、拼音、WordNet、知网

  ④ 同义关系、反义关系、上下位关系、部分关系

概率语法

  ① n阶马尔科夫链语言模型

  ② 隐马尔科夫模型HMM

  ③ 概率上下文无关文法

  ④ 概率链接语法

词法分析

  ① 有词典切分/无词典切分

  ② 基于规则分析方法/基于统计方法

  ③ 最大匹配法(正向、逆向、双向)

  ④ 最少分词法

  ⑤ 基于统计模型法的分词方法

语法理论与句法分析

  ① 规则系统、原则系统

  ② X理论、格理论、管辖理论、θ理论、约束理论、控制理论、界限理论、

  ③ 功能合一文法FUG

  ④ 词汇功能语法、广义的短语结构语法、树连接语法、

  ⑤ 线图分析法:字底向上chart

  ⑥ 概率上下文无关文法PCFG

语义计算

  ① 语义网络:概念关系、事件语义网络表示、事件的语义关系、基于语义网络的推理分析

  ② 格语法:定义、格表、格框架约束

  ③ CD理论:基本动作、剧本、计划

  ④ 主题模型PLSA、LDA

  ⑤ 关键字树

情感分析

意图分析

摘要提取

CRF应用

沈教授
熟练掌握及擅长领域包括机器学习、深度学习、自然语言、语音识别、图像识别、大数据、数据库、搜索引擎、知识图谱、应答机器人、区块链等
开课计划
授权资质
北京总部
010-60190761
helen.jing@skytraining.cn
北京市海淀区王庄路1号清华同方科技广场5层
微信公众号
打开微信扫一扫
上海办事处
137 74242331
mia.zhou@skytraining.cn
上海市静安区南京西路1717号会德丰国际广场
Copyright © 2013 - 2024 北京思科源企业管理咨询有限公司 版权所有  备案号:京ICP备13002958号-1 京公网安备11010802012156号