2023文字分析平台實體操作2(工作坊III):活動紀錄

活動時間:112年10月13日 星期五13:30-17:00

活動地點:國立中山大學管理學院 CM3022 教室

為2023文字探勘與數位轉型服務產學聯盟,舉辦第三場的工作坊,也是招募學術會員後的第一場活動,邀請廠商會員及學術會員,現場加線上視訊共25位參與。

這次活動的主要目的是教導聯盟會員如何使用文字分析平台的初階功能,透過講師的授課,希望會員們能夠熟悉平台的使用方法,以更有效地利用平台提供的資源進行各種不同類型的分析。為了迎合無法親自參加課程的會員,提供同步的現場和線上參與選項,以確保遠端距離的會員都能參與學習。

這場工作坊,由黃三益教授團隊中的蔡易航博士生進行授課,並搭配一位線上教學助理與兩位現場助教在旁協助,即時地提供問題的解決。此次授課內容主題為「資料收集」、「資料前處理」及「文字內容分析」,讓初次接觸或再次接觸的參與者,重新熟悉平台的操作與運用。

先從基本的資料抓取開始課程,如何找尋自己所需的文件,進而進行資料前處理,去除或統一格式、斷句、過濾重要片語及停用詞等,教學的過程中,搭配實際案例的練習操作,讓參與者可經由親自使用,對於文字分析平台的運作流程有更深的體驗,並能夠應用在未來自己想研究的主題或將進行分析的資料上。

接下來,介紹文字內容分析的概念,此次講解正規表達式的應用,來描述字串語法的規則,可針對文字的搜、比對及萃取等,例如:網址、E-mail等資訊,範例情境以在非結構化文字當中分析特定目標內容,及在非結構化文字當中分析特定內容為教學題材。因此希望這次工作坊後,參與者能夠瞭解如何抓取資料並且進行文件處理,最後以文字分析步驟將所需結果以文字雲等圖表的方式呈現出來。

透過工作坊的講課及實際操作過程,讓參與者一步步認識和熟悉如何運用文字分析平台上,進行資料的收集與處理。也透過彼此交流,可互相討論或向講師、助教請教在操作過程上遇到的問題。

最後,由聯盟主持人黃三益教授,進行Q&A與結尾,並且填寫滿意度調查,讓聯盟可以獲得更多相關建議與回饋,感謝參與者對於聯盟活動的支持與鼓勵。下一場工作坊的活動,也即將於12月份舉行,期待聯盟會員們能夠踴躍報名及參加,增進自我的數位化能力與交流不同領域的文字分析相關經驗。