實踐入門NLP:基於深度學習的自然語言處理

..

【雷鋒網-AI慕課學院按】1月初,在被譽為「機器閱讀理解界ImageNet」的斯坦福SQuAD(Stanford Question Answering Dataset)文本理解挑戰賽上   ,微軟亞洲研究院的R-NET模型率先取得了82.650的最高分率,在EM(ExactMatch 精準匹配)指標上首次超越人類在2016年創下的82.304。同時,阿里IDST、騰訊NLP、科大訊飛等也在該榜單名列前茅。

可以說,自然語言的研究歷史雖然還不是很長,但近些年在谷歌、IBM、斯坦福、阿里巴巴、Facebook等NLP領域的核心企業和研究所的推動下,其取得的成績,足以顯示它在人工智能領域乃至整個計算機科學研究的重要性和廣闊應用前景。

特別是最近兩年,基於深度學習的自然語言處理逐漸取得了一定進展,在人機對話、問答系統、語言翻譯等方向的應用也一直是自然語言處理中的熱門話題,而這些應用的實現,基本依賴於底層技術和模型的進步,再加上自然語言處理領域也算是一個多學科交叉的行業,自然語言處理的未來發展對於很多相關學科和方向都具有深遠的影響力。

那麼,對於非NLP相關科班出身的我們來說,如何才能踏入NLP的學習圈子?如何才能選擇低成本,高效率的方式來入門和學習NLP呢?


【NLP工程師入門實踐班】

——基於深度學習的自然語言處理

開車啦!!還不趕緊上車!?


【課程亮點】

三大模塊,五大應用,手把手快速入門NLP

算法+實踐,搭配典型行業應用

海外博士講師,豐富項目經驗

專業學習社群,隨到隨學


【適合人群】

本次課程主要適合具備一定編程基礎的開發人員,以及對自然語言處理和深度學習有興趣的踐行者。


【課程概述 】

本課程將首先介紹自然語言處理的發展現狀與挑戰,同時,講解深度學習和自然語言處理的結合應用。除了基本算法外,本課程還配備實踐環節,從一些典型的方向:機器翻譯、文本分類、問答等。最後,將和大家討論NLP的行業展望以及和各行各業的結合,比如醫療行業等。


【開課時間 】

2018年2月上線,錄製回放視頻可隨時在線反覆觀看。


【講師介紹】

新加坡南洋理工大學   玖強博士

精通算法,軟硬兼修,目前主要研究方向是計算機視覺和自然語言處理結合,例如,圖像/視頻理解, 圖像/視頻自動描述生成,人機對話,多模態檢索。

在算法和神經網絡方面,側重卷積神經網絡,遞歸神經網絡,增強學習,對抗學習,無監督學習等。發表多篇人工智能及計算機視覺頂級會議和期刊,包括ICCV、AAAI oral、PR等,並為多個會議和期刊審稿人。

曾在中科院參與負責基於龍芯的安全芯片項目,后成功轉行深度學習領域,講課風格深入淺出通俗易懂,有獨家學習和轉行經驗。

【課程目錄】

第一模塊 NLP發展歷史介紹和展望 

  1. NLP發展現狀

  2. 傳統NLP方法面臨的挑戰

  3. Big Data和Deep Learning給NLP帶來的變革和機遇

  4. NLP的發展趨勢,以及和各行各業的結合應用


第二模塊 NLP基礎技能

一、數學理論基礎

  1. 概率和信息論

  2. 監督學習、半監督學習和非監督學習

  3. 分類與回歸模型

二、自然語言基礎

  1. Word vector與Word embedding

  2. 什麼是分詞、詞性標註、依存句法分析等?如何利用開源工具包完成

  3. 什麼是統計自然語言處理?

三、深度學習技術

  1. 卷積神經網絡詳解

  2. 遞歸神經網絡詳解

  3. 深度學習常用工具包解析


第三模塊 NLP與深度學習應用

一、文本檢索

  1. 什麼是文本檢索?

  2. 語言模型以及文本表示

  3. 檢索模型訓練以及測試(文本匹配)

  4. 如何評價檢索到的文本好壞?

  5. PyTorch實踐: 基於RNN的文本檢索模型搭建,訓練以及測試

二、文本生成

  1. 什麼是文本生成?

  2. 文本生成的基本模型

  3. 如何評價生成的文本?什麼是生成評價指標?

  4. PyTorch實踐: 基於RNN的機械人寫古詩

三、本文分類

  1. 什麼是文本分類?

  2. 基於CNN的文本分類模型

  3. 基於CNN的文本分類模型

  4. PyTorch實踐: CNN文本分類模型 VS RNN文本分類模型

四、機器翻譯

  1. 什麼是機器翻譯?

  2. 機器翻譯的統計學上的數學定義

  3. 機器翻譯(seq2seq)模型

  4. PyTorch實踐: 搭建並訓練基於RNN的encoder-decoder中英翻譯模型

  5. PyTorch實踐: 拓展練習之--股票預測。

五、問答系統

  1. 問答系統介紹

  2. 基於檢索式的傳統問答系統

  3. 基於生成模型的問答系統

  4. 如何評價系統好壞?

  5. 如何生成更複雜的對話,情感和圖片交互等?

  6. PyTorch實踐: 基於RNN實現一個基本的問答模型


【課程目標】

理解深度學習與自然語言處理技術,並能夠結合自己的行業,運用學到的模型去解決問題。

最後,通過本課程,個人的視野得到極大的擴展,面對各種各樣的數據,不再茫然,具備獨立分析數據的能力。


【學習方式 】

在線聽課 + 在線答疑 + 交流互動 + 社區輔導


【常見問題】

Q1:在哪裡上課?

A:課程直播和回放都在【雷鋒網】AI慕課學院官網(http://www.mooc.ai/)上進行,不需要其他直播軟件。每期直播都有視頻回放,付費學員可反覆觀看,持續有效。


Q2:參加本門課程有什麼要求?

A: 本次課程適合具備一定編程基礎的開發人員,以及對自然語言處理和深度學習有興趣的踐行者。


Q3:會有實際上機演示和動手操作嗎?

A:有,課程進行中涉及實戰項目老師都會準備上機演示部分,學員可以學習老師的實踐經驗。


Q4:課程是否提供代碼和數據集?

A:會提供詳細代碼和數據;


Q5:本課程怎麼答疑?

A:本次課程老師會集中直播答疑【雷鋒網】,保證學員不會因為群信息刷屏錯過答疑。

此外,本課程配備學習助教,定期在付費學員群里及時解答大家學習過程中遇到的問題,保證大家學習無憂。每期課件及代碼資料都會分享到學員群供學員下載。


Q6:報名后是否可以開發票?

A:可以開具發票,請在下單處提交發票申請,填寫發票信息即可

團購更優惠,成團每人優惠200元!
掃碼進群諮詢>>>


想在手機閱讀更多業界資訊資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems