# Large Language Model 模型

大語言模型

之所以被稱為 large,是因為他是經過大量資料進行訓練的模型。
發展過程經歷了:機器學習 -> 神經元 -> 神經網路 -> 深度學習 -> RNN (Recurrent neural network) -> LSTM (Long Short-Term Memory) -> LM (Language model) -> LLM (Large Language model)

簡單來說是一種利用大量文字去訓練的人工智慧,他會針對問題,預測每個答案的下一個字。

  1. 在發明詞向量後,可以透過將文字轉成數學向量,讓電腦理解自然語言。
  2. 而後來 Google 發現經過大量訓練的神經網路模型,可以將類似詞語的向量放在相鄰的位置。