2
論壇與機器學習 (/z/compiling)

台灣的專業論壇生態圈被 FB Group 分散了,像 stackoverflow 這種問答模式漸漸取代了傳統的 forum ... 感覺是另一種 RDBMS vs NoSQL ... 前者有很清楚的結構 (Schema), 後者則不需要有啥結構, 反正找的到 / 方便快速就好 .....

如果後者搭配 Machine Learning / Deep Learning 等方法,自動 category / tag ... 或許會很有搞頭 ...

rick_kyhwang 積分 2 編輯於

ML 有一個很重要的部分,就是討論如何讓機器可以學習『分類』的方法。有了分類,才有辦法建立關聯性。此『分類』概念大概就是現在 FB 用的 hashtag, 一般 blog / news portal 用的 tag, OS X 作業系統內建的 tag .... 但是這些都是『人』去做的,也就是人要先有分類出這些東西的能力。

換句話說,當機器有辦法被『訓練』,然後『學習分類』,從分類中再學習、再分類 .... 基本上人類就 gg 了 XDD

IngramChen 積分 0

在 google + 貼文,它會自動加 tag。某方面來說這段 google 已經完成了自動分類了

rick_kyhwang 積分 1

如果把 ElasticSearch 的概念,加上 Machine Learning ,內建在作業系統,那麼以後『使用者』就不需要『檔案系統』這種結構了。。。檔案的目錄結構也好、Tag 也罷,都給 OS 處理就好。。

以論壇來看,文章會自動產生索引,建立關聯。

Spark 有 ML lib,內建一些演算法,像是 SVM、decision trees ... https://spark.apache.org/mllib/

之前看到的 object detector lib: dlib 也有 ML 部分: http://dlib.net/ml.html