資料儲存系統與應用

資料儲存系統與應用 /z/data-intensive-app

IngramChen 積分 0

這是五月的消息，要最新版 15

貼這個是因為 GCP 今天也支援 pgvector 了

回應 2 years ago

IngramChen 積分 0

以為不用碰 DB

到最後還是自己弄 repository，這種老人一開始就做的事

回應 2 years ago

IngramChen 積分 2

大家一致喊沒 HA 就不看了…

回應 3 years ago

IngramChen 積分 1 編輯於 3 years ago

三種都有用…

offset based 大概就是數量很確定的 table 才能使用。例如終端用戶產生的內容幾乎都不行，因為隨著時間 table 會長大到不可預知。反之則可以。

cursor based 這名字取的不好，hacker news 建議用 token based pagination

token based 就是麻煩在多一個 codec ，實務上我盡量避開，像是 kaif 這個小站1 只用了 keyset based pagination

然後 keyset based 這個分類其實算 token based 的子類。你在設計 rest api 時，就算你的實作是 keyset ，你給別人的 api 也要用 start= 、end= 等變數名稱，而不是 since_id 、since_updated_at 這種會 leak abstraction 的名字 (你難保哪一天你不會修改排序)

https://github.com/kaif-open/kaif/blob/master/kaif-web/src/main/java/io/kaif/model/article/ArticleDao.java

回應 3 years ago

j0n 積分 1

我最近做的服務剛好有遇到 emoji 塞不進 DB 的問題 XD

回應 3 years ago

qrtt1 積分 2 編輯於 3 years ago

2016 年的文，在當時勸世聽起來合理啊。

現在如果要存文字，起手就是 utf8mb4 了。

回應 3 years ago

j0n 積分 1

不是想用，是只能用.. 敝社的 infra 只有 MySQL 可以選

回應 3 years ago

IngramChen 積分 2

其實這個是進入 emoji 時代後大家才發覺的事

手機大量引入 emoji 後，資料庫 log 就開始看到一堆詭異的錯誤

從一開始不要用 MySQL 就沒事了

回應 3 years ago

oktak 積分 2

這個每個人都值得進一次的坑🚭

回應 3 years ago

j0n 積分 1

這篇好紅，到處都看到

回應 3 years ago

wybeen 積分 2

原來是看受歡迎程度, 這樣的話 DB2 居然還在前十蠻令人吃驚的

The DB-Engines Ranking is a list of database management systems ranked by their current popularity.

回應 3 years ago

kaif 積分 1

CMU 同學的筆記1

https://levy.at/blog/22

回應 3 years ago

kaif 積分 0

是說一般 LSM tree 會用 bloom filter 避免 key not exist 時需要 sequential search。他這邊沒有說他是怎麼做的。或許他的 usage pattern 不會有這種狀況，還是反正就慢慢來？

回應 4 years ago

kaif 積分 0

TL;DR: 做一個可以存 PB 數量級 log 的 DB，基於 LSM tree，只是把 DynamoDB 當 ram, S3 當 disk。

標題蠻 misleading 的，一般應該不會把 log 叫做 metadata 吧？

回應 4 years ago

kaif 積分 1 編輯於 4 years ago

討論除了 RDBMS 以外的各種 buzzword 的資料儲存系統，和怎麼用這些系統兜出 scalable/reliable 的應用。

例如用RDBMS 去搭配 noSOL, object storage, message queue... 去做 large scale web application, stream/batch data processing...等等。

回應 4 years ago

IngramChen 積分 0

這新的版是要討論 NAS 和硬碟嗎… ？

回應 4 years ago

Kmark 語法說明

Kmark 是一個類似 Markdown 語法的格式，以下為提供的功能:

種類	語法	呈現
斜體	兩邊加單星	兩邊加單星
粗體	兩邊加雙星	兩邊加雙星
刪除線	~~兩邊加雙曲號~~	~~兩邊加雙曲號~~
引用	> 左邊加個大於符號	左邊加個大於符號
列表	* 可用星號 * 也可以 - 減號 * 數字加點也可以	可用星號也可以 - 減號數字加點也可以
固定寬字	`abcdefghijk` 兩邊用倒引號包住	`abcdefghijk`
編碼區塊	``` function abc() ``` 上下都用三個倒引號包住	`function abc()`
連結	[這是連結][1] [1]: http://example.com 連結第一部份是文字，先用中括號包住，後面再加上 [編號]。第二部份是連結本身，放在文末，開頭是 [編號]: http	這是連結1 1 http://example.com