# OpenRouter

Published 2025-04-29

# 1. Llama3 70B Instruct:

Meta 發佈的 Llama 3 系列中的 70B 參數指令微調模型，優化用於對話場景，在多個行業基準測試中表現優異。

# 2. Llama3 8B Instruct:

Llama 3 系列的 8B 參數版本，適用於資源受限的環境，支援指令微調，適合輕量級應用。

# 3. Llama3.1 405B:

Llama 3.1 系列中的超大模型，擁有 405B 參數，支援多語言和長上下文處理，適用於複雜任務。

# 4. Llama2 70B Chat:

Meta 的 Llama 2 系列中的 70B 參數對話優化模型，專為聊天應用設計，提升了對話質量和安全性。

# 5. Llama Guard 3 8B:

Llama 3.1 系列的 8B 參數模型，專注於內容安全分類，可用於輸入和輸出的內容審核。

# 6. Mistral Large:

Mistral AI 提供的大型語言模型，具體參數未公開，強調高性能和高吞吐量，適合商業級部署。

# 7. Mixtral 8x22B:

Mistral AI 的 Mixtral 模型，採用稀疏專家混合架構（SMoE），總參數為 141B，每次推理激活 39B 參數，實現高效推理。

# 8. Codestral 2501:

Mistral AI 的代碼生成模型，優化了架構和分詞器，代碼生成速度提高約兩倍，在 FIM（Fill-in-the-Middle）任務中表現出色。

# 9. Mistral 7B Instruct:

Mistral 7B 的指令微調版本，支援 32K 上下文窗口，適用於需要長上下文處理的任務。

# 10. DeepSeek V3:

DeepSeek 的旗艦模型，採用混合專家架構，總參數 671B，每次推理激活 37B 參數，支援超長上下文處理，適合複雜任務。

# 11. DeepSeek R1:

DeepSeek 的 R1 模型，專注於數學、代碼和複雜推理任務，採用強化學習訓練，開源且成本效益高。

# 12. Qwen2.5 72B Instruct:

通義千問系列的 72B 參數指令微調模型，適用於複雜指令執行和多領域應用。

# 13. Qwen-Turbo/Plus/Max:

通義千問系列的三個變體：Turbo 強調速度，Plus 提供平衡性能，Max 支援更長上下文和複雜任務，適用於不同需求。

# 14. Gemini Pro 1.0:

Google DeepMind 的 Gemini Pro 模型，支援多模態輸入，具備強大的推理和編碼能力，適合複雜任務。

# 15. Gemma 2 27B:

Google 發佈的開源模型，參數為 27B，旨在為開發者和研究人員提供高性能的語言模型。

# 16. Command R+:

Command 系列的增強版模型，強調命令執行、任務規劃和多步推理，適用於企業自動化等應用。

# 17. Command R:

Command 系列的基礎版模型，用於命令執行和簡單推理，適合一般任務和低延時需求場景。

# 18. GPT-4/GPT-4 Turbo:

OpenAI 的 GPT-4 系列模型，支援多模態輸入，GPT-4 Turbo 為優化版本，具有更低延遲和更大上下文窗口。

# 19. GPT-3.5 Turbo:

OpenAI 的 GPT-3.5 系列中的高速、經濟版本，主要用於實時對話和簡單任務。

# 20. Claude v2.1/v2:

Anthropic 推出的 Claude 系列模型，重點關注安全性和輸出對齊，提供柔和、禮貌的對話體驗。

# 21. Grok 3 Beta:

xAI 推出的 Grok 3 Beta 模型，處於測試階段，以其獨特的幽默和個性化回覆著稱，具備一定圖像生成能力。

# 22. TheDrummer: Anubis Pro 105B:

參數規模為 105B 的大型模型，定位為專業版，適用於複雜和高精度的大規模任務。

# 23. Goliath 120B:

超大規模的 120B 參數模型，提供頂級通用語言理解與生成能力，適合企業級和高要求應用。

# 24. Llama3.3 Euryale 70B:

Llama 3.3 系列中的 70B 參數模型，經過進一步優化，提升了推理能力和對話質量。

# 25. NeverSleep: Lumimaid v0.2 70B:

NeverSleep 推出的 Lumimaid v0.2 模型，擁有 70B 參數，專注於持續對話和多輪交互，適用於長時間對話任務。

# 26. Nous: Hermes 3 405B Instruct:

Nous Research 發佈的 Hermes 3 系列中的 405B 參數指令微調模型，強調高質量指令跟隨和多語言支援，適用於複雜任務。