dolmino-mix-1124
dolmino-mix-1124數據集豐富了OLMO2培訓,並具有不同的高質量文本,以改善NLP模型性能。
什麼是多爾米諾混合1124
Dolmino Mix 1124是一個綜合數據集,結合了DCLM Flan Pes2O和Wiki等各種高質量來源。它包括各種文本類型,例如網頁STEM論文和旨在增強自然語言處理模型的百科全書。適用於研究人員開發人員和企業此數據集支持多個NLP任務,尤其是在文本生成中。