#
OpenRouter
Published 2025-04-29
#
1. Llama3 70B Instruct:
- Meta 發佈的 Llama 3 系列中的 70B 參數指令微調模型,優化用於對話場景,在多個行業基準測試中表現優異。
#
2. Llama3 8B Instruct:
- Llama 3 系列的 8B 參數版本,適用於資源受限的環境,支援指令微調,適合輕量級應用。
#
3. Llama3.1 405B:
- Llama 3.1 系列中的超大模型,擁有 405B 參數,支援多語言和長上下文處理,適用於複雜任務。
#
4. Llama2 70B Chat:
- Meta 的 Llama 2 系列中的 70B 參數對話優化模型,專為聊天應用設計,提升了對話質量和安全性。
#
5. Llama Guard 3 8B:
- Llama 3.1 系列的 8B 參數模型,專注於內容安全分類,可用於輸入和輸出的內容審核。
#
6. Mistral Large:
- Mistral AI 提供的大型語言模型,具體參數未公開,強調高性能和高吞吐量,適合商業級部署。
#
7. Mixtral 8x22B:
- Mistral AI 的 Mixtral 模型,採用稀疏專家混合架構(SMoE),總參數為 141B,每次推理激活 39B 參數,實現高效推理。
#
8. Codestral 2501:
- Mistral AI 的代碼生成模型,優化了架構和分詞器,代碼生成速度提高約兩倍,在 FIM(Fill-in-the-Middle)任務中表現出色。
#
9. Mistral 7B Instruct:
- Mistral 7B 的指令微調版本,支援 32K 上下文窗口,適用於需要長上下文處理的任務。
#
10. DeepSeek V3:
- DeepSeek 的旗艦模型,採用混合專家架構,總參數 671B,每次推理激活 37B 參數,支援超長上下文處理,適合複雜任務。
#
11. DeepSeek R1:
- DeepSeek 的 R1 模型,專注於數學、代碼和複雜推理任務,採用強化學習訓練,開源且成本效益高。
#
12. Qwen2.5 72B Instruct:
- 通義千問系列的 72B 參數指令微調模型,適用於複雜指令執行和多領域應用。
#
13. Qwen-Turbo/Plus/Max:
- 通義千問系列的三個變體:Turbo 強調速度,Plus 提供平衡性能,Max 支援更長上下文和複雜任務,適用於不同需求。
#
14. Gemini Pro 1.0:
- Google DeepMind 的 Gemini Pro 模型,支援多模態輸入,具備強大的推理和編碼能力,適合複雜任務。
#
15. Gemma 2 27B:
- Google 發佈的開源模型,參數為 27B,旨在為開發者和研究人員提供高性能的語言模型。
#
16. Command R+:
- Command 系列的增強版模型,強調命令執行、任務規劃和多步推理,適用於企業自動化等應用。
#
17. Command R:
- Command 系列的基礎版模型,用於命令執行和簡單推理,適合一般任務和低延時需求場景。
#
18. GPT-4/GPT-4 Turbo:
- OpenAI 的 GPT-4 系列模型,支援多模態輸入,GPT-4 Turbo 為優化版本,具有更低延遲和更大上下文窗口。
#
19. GPT-3.5 Turbo:
- OpenAI 的 GPT-3.5 系列中的高速、經濟版本,主要用於實時對話和簡單任務。
#
20. Claude v2.1/v2:
- Anthropic 推出的 Claude 系列模型,重點關注安全性和輸出對齊,提供柔和、禮貌的對話體驗。
#
21. Grok 3 Beta:
- xAI 推出的 Grok 3 Beta 模型,處於測試階段,以其獨特的幽默和個性化回覆著稱,具備一定圖像生成能力。
#
22. TheDrummer: Anubis Pro 105B:
- 參數規模為 105B 的大型模型,定位為專業版,適用於複雜和高精度的大規模任務。
#
23. Goliath 120B:
- 超大規模的 120B 參數模型,提供頂級通用語言理解與生成能力,適合企業級和高要求應用。
#
24. Llama3.3 Euryale 70B:
- Llama 3.3 系列中的 70B 參數模型,經過進一步優化,提升了推理能力和對話質量。
#
25. NeverSleep: Lumimaid v0.2 70B:
- NeverSleep 推出的 Lumimaid v0.2 模型,擁有 70B 參數,專注於持續對話和多輪交互,適用於長時間對話任務。
#
26. Nous: Hermes 3 405B Instruct:
- Nous Research 發佈的 Hermes 3 系列中的 405B 參數指令微調模型,強調高質量指令跟隨和多語言支援,適用於複雜任務。