進階文字探勘工作坊:活動紀錄

現場參與的聯盟會員合影
黃三益教授開場介紹
蔡易航博士與會員們講解文字分析平台
實際操作練習
  本「文字探勘與數位轉型服務產學聯盟」,籌備了第二場的培訓坊,目的是為教導聯盟會員們使用文字分析平台更進階的功能,藉由教授及講師精心準備的授課內容,讓聯盟會員們能夠熟悉本平台的操作方式,促使聯盟會員們將資源使用的淋漓盡致,並進而有效地利用平台所提供的資源來進行更多樣的分析。為因應部分會員可能無法實體到課而錯過精彩的授課內容,故本次活動依然採用同步現場及線上參與的方式,讓線上和實體的會員們同時進行學習。
  而在第二場的培訓中,是由黃三益教授團隊中的蔡易航博士生進行授課,並且搭配兩位助教於現場協助,能即時地為疑惑的會員們提供幫助。此次授課內容針對「進階情緒分析」、「主題模型」及「文件分類」進行教學,在教學的過程中,會搭配一些實際案例,讓聯盟會員們在實務上的分析流程有更深的體會,並能夠將其應用在未來自己想做的主題上。
  首先,教學的開頭,講師蔡易航以 Lexicon Based 與 Corpus based 兩種情緒分析作為主題,就兩者進行練習與講解,而後解釋關於情緒的句法結構,緊接著介紹主題模型與文件分類的基本概念,待所有聯盟會員對上述授課內容都有相當程度的理解後,再根據不同的任務讓會員們進行操作。除此之外,教學內容也包含:模型的參數設定、模型評估、將分析結果呈現視覺化圖表…等。因此在參與這次工作坊後,聯盟會員們能夠學會如何訓練模型並調整參數,在眾多模型取得最佳模型,並進行資料分析,最後將分析結果搭配視覺化的方式呈現。
  本次工作坊透過詳盡的實作過程,讓參與的聯盟會員逐步了解如何在文字分析平台上,進行資料的進階分析,而在工作坊的最後,本聯盟規劃了一段互動時間,在這段時間裡,聯盟會員們能夠彼此相互交流,也能夠向教授或講師請教在操作過程上遇到的難題。同時本聯盟也鼓勵各位聯盟會員若是在後續的實作過程中,有遇到技術上的相關問題,或是對平台的使用上有任何想法,都可以提出來與本聯盟交流討論,而本聯盟未來也會籌劃其他的活動或服務,歡迎各位聯盟會員們踴躍參加。