2024 Tarflow文本分析(工作坊IV):活動紀錄

「文字探勘與數位轉型服務產學聯盟」第四場工作坊—Tarflow文本分析為聯盟本年度最後一場工作坊。地點特別選在台北松菸場地,讓中北部的廠商會員、學術會員及潛在會員,可以藉此機會認識文字分析工作流程平台的功能與操作,以現場實體及線上參與的方式同步進行,並安排現場及線上助教,課程中有實際操作的練習時間,隨時給予指導與解決問題,讓參與者一邊學習、一邊思考將文字探勘技術運用在自己的工作領域或研究分析資料上。

首先,由聯盟主持人黃三益教授開場致詞與介紹聯盟,2024的第四場工作坊,有新的廠商會員、學術會員加入及對於文字分析工作平台有興趣的潛在會員們,從聯盟目前的技術服務、產學合作計畫等簡介作為開場,讓參與者更進一步認識聯盟,再經由工作坊的實際操作,體驗數位化工具的功能。

接著,由黃三益教授團隊中的張家銘博士生進行今日的主題授課,內容為「文字雲與情緒份析案例」及「主題模型案例」,並安排兩位現場助教、一位線上助教在旁協助,引導所有參與者從資料前處理、情緒分析及主題模型三個項目進行學習。

課程開始,講師先說明文字分析平台功能與資料抓取等基本內容,基礎新手入門開始,若遇到問題可隨時舉手請現場助教指導,所以在參與這次的工作坊後,參與者能夠了解文字分析平台的運用方式,包括資料爬取與前處理、斷句和停用詞等操作,執行出資料處理後的任務結果及文字雲。

情緒分析案例中,可用一篇文章、一個段落或一個句子來判斷出情緒正面或負面之取向,讓參與者事先匯入情緒字典於文字分析平台中,經由講者的說明與實際練習,分析出文本中的情緒取向;主題模型案例則可利用人工或自動找出主題,LDA參數設定下可在資料裡找出主題數量,並能夠應用其功能來進行相關的意圖分類。

最後,聯盟安排互動交流時間,讓參與者提問或進行交流。預計將明年1月舉行聯盟期末交流說明會,希望聯盟會員踴躍參加,繼續給予聯盟支持與鼓勵。