☁️LangSmith平替Cloudflare发布 AI Gateway
type
status
date
slug
summary
tags
category
icon
password
LangSmith 平替,几行代码搞定 AI Ops,赛博菩萨 Cloudflare 正式发布 AI Gateway!!
- 支持 AI 应用的性能,安全,可靠性和可观测性分析 👁️
- 支持多 LLM 负载均衡,支持 OpenAI,Amazon 等各种模型 :
- 未来支持构建数据集,微调模型
- 与 Workers AI 整合无缝体验
Workers AI 是 Cloudflare AI Platform 的一部分,主要为模型提供推理加速的 Infra Host 平台
同时借助 Cloudflare 的平台和基础设施优势,可以支持更低的成本和更快的速度 Host Lora finetune 的 Huggingface 模型
比如 Llama2 降低 7 倍成本,Mistral 7B 降低 14 倍
Cloudflare 同时提供 AI Playground 和 Dashboard 方便分析 AI 应用的消耗和成本控制
Cloudflare 支持与 Langchain 整合使用
AI Gateway 支持的模型涵盖主流的模型 Anthropic, Azure, AWS Bedrock, Google Vertex, and Perplexity
Workers AI 还支持 Embedding Model
基于 Huggingface 的 TGI https://github.com/huggingface/text-generation-inference…,Cloudflare 支持 serverless GPU Host 14+ 模型,包括 Mistral 7B,Google Gemma 7B,DeepSeek
Loading...