自然語言處理
本實驗室主要利用深度學習技術於文字資料探勘與自然語言處理(Text Mining and Natural Language Processing)之研究,目前實驗室研究成員之研究主題著重於機器閱讀理解(Machine Reading Comprehension)與自然語言生成(Natural Language Generation)兩面向。
TL;DR 請見我們實驗室的demo Try Here
我們基於深度學習技術,開發一閱讀檢測試題自動生成系統,透過文字生成技術(Natural Language Generation)幫你出問題製造考卷,主要是根據你所輸入的課文、短文、閱讀測驗或關鍵字,產生出相關對應的題目,這項服務要解決製作教材人力成本的痛點,能夠自動、快速而且大量產生符合需求的題目,再由老師編輯符合需求的客製化考題。( Querator AI) 目前可同時支援中、英文兩語言,預計未來將支援更多語系。我們透過深度學習文字生成技術的突破,將大幅減低出版業、行銷業務與教師於閱讀檢測中人力成本,為相關產業提供協助、創造更多價值。(with 詹英鴻、鄭高文、黃柏鈞、蔡霈炫、徐偉耀)
我們基於利用深度學習技術整理裁判書資料並萃取為人、事、時、地之結構化資訊。希冀找出隱藏於裁判書資料中之關聯資訊。基於法院判決書共現關聯,建立人物社群關聯網絡,建立視覺化社群結構分析如影片中所例,其中節點為所有判決書中曾出現之人名,邊為兩個人物曾共同於一篇法律判決書出現。(with 郭溫蘋、姜力綱、翁偉哲)
結核病因為長期占據全球十大死因榜單之一而一直被人們所慎重對待,對於結核病的相關檢測及研究也隨著時間持續地被推出。由於現今結核病只要受到完善的治療幾乎都可痊癒,也因此讓結核病的檢測更顯得重要。然而,對於某些開發中國家,結核菌的檢測因為費用昂貴以及檢測設備的龐大與電源供應需求,始終無法作為其廣泛的篩選方法,因此本專題預計與台灣大學醫工所陳建甫教授跨領域合作,基於其研究團隊所開發之「螢光奈米銅團簇於聚合酶鏈鎖反應檢測」技術,並結合機器學習CNN(Convolution Neural Network)類神經網路影像辨識的技術,讓電腦自主學習分辨試管的呈色結果,來協助現有試管反應呈色後無法精準且快速分辨呈色結果之問題。(with 王韋鈞、沈柏瑋)
活動主辦方要將所有活動照片根據參加者分類,而且只有一張參與者大頭照的情況下,要辨識出他出現過在哪些照片中,是件非常累人的事情。所以此專題設計一個網頁,讓使用者上傳全部的活動照片和一張大頭照,再將大頭照轉成3D模型,透過自動旋轉3D模型截取更多角度的臉部照片,最後利用人臉辨識篩選所有活動照,挑選出含有目標者的照片。只需要一張正面照,就可以增加訓練資料,提高人臉辨識度,讓分類照片變得輕鬆且省時。(with 鄭筠庭、蔡佳樺)
本專題旨在找出社群論壇上屬於網軍的ID,我們將PTT上的留言進行情緒分析,得到留言者的言論傾向, 蒐集留言者IP進行比對,再根據留言者發文時間分布分析,最後得到該留言ID是網軍的機率高低,並依照高低程度排序羅列於網頁上,我們還將相關資訊一併顯示於網頁,為的是取代傳統搜尋方式,讓網路上的閱聽人能夠方便,快速的取得經整理過後的資訊,省下大量時間,輕鬆找出疑似為網軍的ID。(with 王浚睿、董欣謙)
即時的用電資料,可以被視為一個建築物事件感測器,可偵測一個建築單位中之各種事件;由於電力的使用主要來自於建築單位的使用者,電力資料上的趨勢與變化,其背後隱含著各式各樣的事件。我們利用自行開發之電力感測器系統實地搜集中興大學理學大樓各樓層用電資料。我們將電資料使用熱點圖(Heat Map Image)觀點來呈現。於下圖中我們顯示以2015年3月25日起至2015年8月9日止的理學大樓八樓之每日用電資料來進行熱點圖繪圖之結果。圖中每一行為一日之用電資料,每一行之寬度為10個像素點。每一列之高度亦為10個像素點,記錄每十分鐘之用電量。影像中最小單位為10×10之像素區塊,表示為某一日期之某十分鐘區間內之總用電資料,每日總計144(6×24)筆電力消耗數據。我們也依電力消耗之程度值分別著色,白色部分為缺值資料,綠色表示電力消耗量較小,紅色表示電力消耗量較大,按不同程度數值進行顏色深淺。若我們從此角度出發,我們可以從較全面的觀點來檢視我們所收集之用電資料。我們可以發現很多有趣的觀察。例如,用電量的程度變化確實與人之作息高度相關,我們可以看到早上八點鐘左右用電量會逐漸增加,午間時段用電量稍減,一點鐘左右又開始增加直到下午四點左右用電量逐漸減少。我們也可以觀察到連續五行(五天)紅色高用電量後,通常跟著兩行(兩天)綠色低用電量,也可以看到連續出現的低用電量為2015年之春假期間。我們也建立一資料視覺化平台供使用者下達查詢與取得實際用電資料,與創建自定義區間之熱點圖 http://140.120.13.242:27017/power/(with 陳聖軒,翁湘雲)
我們利用台中市公車資料集結合資料視覺化技術,呈現台中市人流之一天二十四小時的人流變化,每十分鐘為一單位,圖中圓點面積對應於人流多寡,越多人流越大面積。可以有趣地看出台中市人流的移動與變化(with 吳昭儀, 熊庭緯)
在這個資訊爆炸的時代,查閱報表是一件很沒效率的事情;假設今天有一位市長,因為平日工作繁忙,所以希望可以一眼就看出他施政上的缺失,這個時候如果還要查閱一大堆紙本的報表或是Execl圖表的話真的會讓人很挫折。我們希望能將各類資料報表給資料視覺化,目前利用ptt上面的民眾留言,使用文字探勘的方式去分析民眾對於某一議題的情緒是支持還是反對,再結合地圖呈現,讓決策者可以一目了然,知道不同地區對於此億議題的態度是如何。隨著多種資料一起呈現在地圖上,除了一目了然、節省時間以外;還會提供新的觀點,過去被認為完全不相關的資料被擺在一起檢視的時候,可能產生意想不到的效益(with 張泰瑋, 黃翔宇)
一場長達三、四個小時運動或是電競的比賽直播結束後,官方會推出一系列的精彩賽事剪輯,但是這些畫面的剪輯必須聘請一位人員隨場紀錄什麼時刻發生了什麼事,再外包給私人的影像工作室以而且剪輯的人工費用相當高,所以我們開發出一個系統利用網路社群提供的種種資訊加速剪輯時間、降低剪輯成本,即為鄉民的力量。我們利用爬蟲抓取社群平台上的比賽直播文,再使用兩種不同分析方法,將直播文與比賽影片結合取代以往精采賽事影片高成本的人工剪輯方式,讓使用者能一鍵觀賞本場比賽的精華片段或是輸入自己感興趣的關鍵字取的相對應的精華片段。(with 楊尚恩, 郭介騵)
世界衛生組織(WHO)於2013 年的報告指出,2020 年全世界將有三大疾病:心血管疾病、憂鬱症與愛滋病。憂鬱症已成為人類的第二危險殺手。憂鬱症經常是未被注意、而且沒有被治療的。於台灣社會中,憂鬱的人多否認或輕忽他們的症狀,或把他們合理化,認為僅是壓力造成的。許多人因為誤將憂鬱症的診斷聯結成人格或意志力的挫敗,而刻意不求助醫師,也造成難以挽回之後果。在本研究中,我們嘗試結合幾乎24小時陪伴於現代人左右之智慧型手機,結合文字分析技術與機器學習演算法,主動地判斷手機持有者可能出現憂鬱之傾向,進而提供相關協助者進行幫助。 (with 游哲軒, 溫景翔, 劉凱婷, 陳奕廷)
世界能源短缺,人們必須有效利用能源,而最基礎的一步即為量測。Povon為一個雲端電力量測系統,Povon字義為世界語中Power的意思,為中興資工系范耀中老師與同學合力開發,從電力感測器硬體開發,網路通訊架構,雲端平台建立,從下到上皆為中興資工系同學之研究成果,擁有極高之技術自主性。Povon雲端監控平台擁有以下特色: (1)快速佈建: 不需特定施工,一般使用者即可裝設。採非侵入式架構,不需碰觸實體電線,安全性高。(2)電力線通訊:Povon採用電力線通訊架構,能無縫地融合於建築物實體環境,相較無線通訊架構,電力線通訊架構擁有低成本與穩定優勢。(3)低硬體成本:硬體採用開放原始碼微控制器arduino與Atmel AVR單晶片,結合電力網路通訊模組,與電流感測器,提供低成本之電力量測單位。(4)• 隨插即用:不需進行設定,開機後即可使用。(5)雲端服務: 採用雲端服務架構,低主機維護成本。(6)即時電力量測: 利用專屬app與網頁瀏覽器可即時觀測用電數據,也提供多功能之歷史查詢與用電分析功能。(with 何青祐, 施宗呈, 廖志豪)
。根據資策會MIC的調查,高達81%的消費者在購物前,有使用網路搜尋口碑訊息的習慣。然而網路口碑四散於處,現階段仍仰賴使用者自行檢索。「聽大家說」這個網站的構想:就是透過大量收集網路上對某一事物的評價,讓使用者能夠透過統合之後的大眾觀感去了解事情;而非只是由片面的資訊造成對事物的誤解。這個平台可以幫助使用者從各方面獲得訊息,了解大多數人對事件的意見有鑒於此,我們的專案著眼於主動式地整合網路口碑,並開發一網路服務提供使用者整合過後之網路口碑資訊。定時蒐集各大論壇中的文章,如PTT、Mobile01等論壇,並利用後端程式將文章拆解分析放入資料庫以找出文章主題及和主題相關的形容詞,。請見以下影片介紹 (with 郭紫玫, 葉丞翰, 劉昭陽)
因現今提倡節能減碳,且公共自行車租賃系統的普及化,騎自行車的人越來越多,但至今尚未有適用於自行車的導航裝置,因此我們製造出自行車智慧導航,提升了自行車騎士的方便性。經由自行車去外地參觀、旅遊時,面對地理位置的不熟悉,在自行車龍頭上放置此自行車智慧導航裝置,將可使問題迎刃而解。將此裝置架設於自行車龍頭上,並將智慧型手機的藍芽與定位功能開啟,利用我們所開發的APP說出要到達的目的地即可。原本GPS衛星導航只能裝置在有空間放置的汽車上,但透過此自行車智慧導航可以讓你輕鬆自在踩著自行車到處遊玩,而不會有一直停下來查看地圖或手機導航的不便性及危險性。我們僅需約一片Arduino(80元)、藍芽(50元)與一LED燈指示裝置(60)。我們另用自由軟體進行開發並利用免費的雲端服務來進行低成本裝置之建構。請見以下影片介紹(with 莊喬甯,巫德亮,張雅晴)
現代生活快速的步調使我們隨時有處理不完的事情待辦與資訊待消化。大量的資訊疲勞轟炸,常讓我們應接不暇,於生活上忘東忘西。隨著智慧型行動裝置之普及,一個常見的方式來協助使用者管理待辦事項之方式為使用備忘錄軟體,由使用者事先記錄待辦事項以為未來查詢之用。也因此,在智慧型行動裝置應用程式商店裡擁有形形色色之各類備忘錄記事本應用軟體,來協助使用者管理與提醒使用者待辦之事項。然而現有之行動備忘錄軟體,於理想上仍有一段距離。多數的備忘錄軟體其提醒功能皆是以時間為觸發條件,例如於18:00時提示使用者待辦事項,提醒使用者記得前往便利超上購買鮮奶與繳交停車費。然而,以時間為基準的提醒,常常因為使用者手頭上仍有事情正在處理,不可能馬上放下手邊工作,前往便利商店執行待辦事項,而手頭事情處理完畢後,常常待辦事項也一併地被遺忘,因此多數狀況下利用時間來提醒的鬧鐘功能並不理想。理想的備忘錄軟體應提供以地點為觸發基準之提醒功能,例如當使用者下班後經過便利商店時,該備忘錄軟體能夠察覺該事件,並即時地提示使用者購買鮮奶與繳交停車費。 TeleNote擁有以下特色:不需開啟行動裝置上之GPS感測器、也不需網路連線、也不仰賴Google Place之服務。TeleNote可於無網路連線狀態下提供以地點為觸發提醒功能,即時地具適地性地來提醒使用者待辦事項。(with 李偉宏,任仲婷, 許嘉豪)
本研究計畫擬協同工業技術研究院團隊,延伸前 期計畫成果,延伸發展一個基於行動裝置使用內容短字詞語意分析(Short Text Semantic Understanding)與多面向使用者興趣側寫檔研究之適時適地 IOI(Item-of-Interest)提示系統,該系統將主動地分析推測使用者之短字詞語意與考量各種面向下之使用者興趣側寫檔,推測行動裝 置使用者當下之可能感興趣項目(Item-of-Interest),來提示使用者希冀提供行動裝置持有者更 智慧化與更即時之智慧型行動裝置服務(105-106年工業技術研究院斷金計畫, NTD: 2,600,000)
於 2014 年迄今,我們協助國立中興大學進行校園用電之量測;由中興資工系同學利用 開源硬體,自行建置電力量測裝置,量測中興大學理學大樓總計十層樓之即時用電資料。利 基於開源硬體與感測裝置技術之普及,我們所建置之電力量測裝置成本低廉,並且具有即時 上網能力,使得大量且廣泛地布建於電力感測器於各樓層空間並密集地記錄每秒鐘之用電量 成為可能。目前我們所建立之平台之詳細用電資料從 2014 年 12 月 10 日收集至今,每層樓 總計 12 個感測器,分別記錄每一層樓中 12 個用電分區之個別每秒鐘用電資料,電力監控範 圍涵蓋教師研究室、授課教室、研究生實驗室及系所辦公室。總計 10 層樓,120 個感測器, 收集資料已逾一年。而除了當初所設定之校園用電量測目標外,我們發現我們所建立之校園 電力監控平台為一個物聯網研究之試金石;即時且密集的電力量測資料,提供我們一個豐富 的資料集,讓我們探索其可能之應用與研究。因此於本研究計畫中,我們擬定探索現有所收 集到之用電資料,並以其於建築空間中事件偵測之可能性進行研究議題探討。(105-106科技部專題研究計畫 NTD: 702,000)
隨著時代的演進,智慧型行動裝置無所不在地融入我們的生活,智慧型行動裝置幾乎隨時隨地的伴隨著使用者,而本計畫著基於前期研究計畫執行過程中了所累積之大量使用者之智慧型行動裝置使用資料,認為探勘分析出使用者之身份資訊、個人興趣、社群關係網路、使用者個人移動習慣將為可能。因此本研究計畫於行動裝置資料探勘角度來切入分析智慧型行動裝置使用者。(103-105科技部專題研究計畫(兩年期) NTD: 1,616,000)
由於智慧型行動裝置的普及與使用者的高接受程度,智慧型行動裝置幾乎隨時隨地地伴隨著使用者。我們認為智慧型行動裝置不僅僅只是一具迷你隨身電腦,事實上,智慧型行動裝置可視為一行動裝置持有人之資料蒐集器與行為觀察者,行動裝置上所搭載的感測器元件與行動裝置的持有者使用裝置之歷史紀錄提供我們各式各樣極富價值之資料,此種方式之資料蒐集也將更貼近使用者與更無所不在。未來行動運算程式的發展將會整合雲端、行動科技、社會網絡與龐大資料分析等技術產生極大的市場規模與商業價值。通訊產品硬體利潤大幅降低之後,消費性行動應用與服務將是未來行動裝置開發之趨勢。有鑑於此,本研究計畫擬協同工業技術研究院,開發一基於行動裝置使用內容關鍵字檢索與探勘之適時適地地理活動推薦系統,該系統將主動地分析推測使用者之喜好,並根據所推測之結果,即時地推薦行動裝置持有者所在地點附近之可能感興趣活動,希冀提供行動裝置持有者更智慧化與更即時之適地性服務。(104年工業技術研究院斷金計畫, NTD: 1,661,750)
本計畫為一與hTC宏達電子之產學合作研究計畫,由hTC提供120具開發中之智慧型行動裝置發放於大學校園使用,該行動裝置上裝配有資料蒐集app,負責蒐集諸如使用者之行動軌跡、通話資訊、app的使用方式等使用者資料,並計畫透過發展巨量資料探勘技術,來瞭解HTC使用者,提升並改善hTC裝置之開發與良好服務之提供。(宏達電子hTC產學研發計畫, 兩年期2013.01-2014.12, NTD: 2,676,000. 共同主持)
本計畫為上述計畫之延續性計畫,並進入102國科會優秀年輕學者研究計畫面試複審,著眼於上述即時地理資訊查詢雛型系統,轉化為實際服務運轉所面臨的技術議題。諸如如何確保查詢處理的效率與結果的品質、如何刺激群眾使用者的參與及大規模應用時的擴充度與海量資料處理等問題。(群眾感測器查詢處理平台最佳化技術研究, 國科會優秀年輕學者研究計畫決選入圍, Grant No. NSC 102-2221-E-005- 073, NTD 785,000, 102國科會專題研究計畫)
本計畫主要探討如何於單點偵測的架構下,使用間接感測之方式估算非定量功率消耗之電器(如電腦與變頻式冷氣機)電力消耗量,此類之電器為現有非侵入式居家負載準確率不佳的主因,因此如何估算其電力消耗,並用之排除非定量功率消耗之電器於整體系統所造成之影響,來提升電器辨識準確率便成為一研究主題。(半年期2013.07-2013.12, NTD: 175,000.)
本計畫結合智慧型行動裝置與群眾外包概念(Crowd sourcing),建立一個架構於Amazon Web Service雲端平台上之即時地理資訊查詢系統,提供使用者查詢現有地理資訊系統(如Google Map)所無法提供的具即時性與任意性資訊。(Grant No. NSC. 101-2218-E-005-003, NTD 541,000. 101國科會專題研究計畫)
As a Member of the Multimedia and Knowledge Engineering Laboratory, supervised by Professor Arbee L.P. Chen,working on query processing and query optimization over sensor data streams.
As a Visiting Scholar of the Pervasive Data Access (PDA) Research Group in 2010, hosted by Professor Wang-Chien Lee
My Dissertation received the 2011 Taiwan Institute of Electrical and Electronic Engineering Doctoral Dissertation Award.
As a Second Lieutenant, a Platoon Commander of Military Police
As an Assistant Professor
In Proceeding of the 22th IEEE Symposium on Parallel and Distributed Processing, IPDPS2008. (Full Paper, Acceptance Rate:22.5%, EI) (with TCPP Student Travel Award)
In Proceeding of the 20th IEEE International Conference on Parallel and Distributed Systems, ICPADS 2009. (Full Paper, Acceptance Rate:29%, EI)
In Proceeding of the 20th International Conference on Database and Expert Systems Applications, LNCS, DEXA2009. (Full Paper, Acceptance Rate:17.5%, EI)
IEEE Transaction on Parallel and Distributed Systems. Vol.11, no 11, pp1675-1691, 2010. (EI, SCI, impact factor: 1.796, journal ranking:16/100)
In Processing of the 9th IEEE International Conference on Ubiquitous Intelligence and Computing, UIC2012.
IEEE Transaction on Knowledge and Data Engineering. Vol.24, no 8, pp1463-1477, 2012. (EI, SCI, impact factor: 1.892, journal ranking:22/132)
In Proceeding of the 9th IEEE conference on Distributed Computing in Sensor Systems, DCOSS 2013.
In Proceeding of the 9th IEEE conference on Distributed Computing in Sensor Systems, DCOSS 2013.
In Proceeding of the 19th IEEE International Conference on Parallel and Distributed Systems, IEEE ICPADS 2013
In Proceeding of the 19th IEEE International Conference on Parallel and Distributed Systems, IEEE ICPADS 2013
In Proceeding of of the ACM 29th Symposium On Applied Computing, ACM SAC 2014 (EI)
ACM SIGAPP Applied Computing Review
International Journal of Web and Grid Services.(EI, SCI, impact factor: 1.615, journal ranking: 28/132)