Compare · AI Inference

What's on offer.

APIs for running AI and machine learning model inference.

Offerings

45 offerings on this page with service context, pricing, regions, and links.

Tencent CloudService details

Offering

Tencent Cloud AI — NLP, Vision & LLM APIs

Offering details

Usage-based$0.0008 per 1000 tokens (Hunyuan Lite)5 regions

Hunyuan LLM: Bilingual Chinese-English LLM; Computer Vision: Face, OCR, image recognition; +3 more

Documentation Live status

TenstorrentService details

Offering

Tenstorrent AI Inference Cloud

Offering details

Usage-based$0.500 per hour (Wormhole card)1 region

LLM Inference: Cost-efficient token generation; Open Software Stack: TT-Buda inference framework; +1 more

Documentation Live status

Together AIService details

Offering

Together AI — Open-Source Model Inference Platform

Offering details

Usage-based$0.0001 per 1M tokens (Llama 3.2 8B)2 regions

Model Catalog: 100+ open-source models; Serverless Inference: Pay-per-token pricing; +3 more

Documentation Live status

Together AIService details

Offering

DeepSeek V3.1 on Together AI

Offering details

Pay-as-you-go$0.600 1M input tokens0 regions

Context Window: 128000 tokens; Input Modalities: text

Documentation Live status

Together AIService details

Offering

GLM-5 on Together AI

Offering details

Pay-as-you-go$1 1M input tokens0 regions

Context Window: 202752 tokens; Input Modalities: text

Documentation Live status

Together AIService details

Offering

GPT-OSS 120B on Together AI

Offering details

Pay-as-you-go$0.150 1M input tokens0 regions

Context Window: 128000 tokens; Input Modalities: text

Documentation Live status

Together AIService details

Offering

GPT-OSS 20B on Together AI

Offering details

Pay-as-you-go$0.050 1M input tokens0 regions

Context Window: 128000 tokens; Input Modalities: text

Documentation Live status

Together AIService details

Offering

Kimi K2.5 on Together AI

Offering details

Pay-as-you-go$0.500 1M input tokens0 regions

Context Window: 256000 tokens; Input Modalities: text, image

Documentation Live status

Together AIService details

Offering

Llama 4 Maverick on Together AI

Offering details

Pay-as-you-go$0.270 1M input tokens0 regions

Context Window: 524288 tokens; Input Modalities: text, image

Documentation Live status

Together AIService details

Offering

Qwen3.5 397B on Together AI

Offering details

Pay-as-you-go$0.600 1M input tokens0 regions

Context Window: 262144 tokens; Input Modalities: text

Documentation Live status

Together AIService details

Offering

Qwen3 Coder 480B on Together AI

Offering details

Pay-as-you-go$2 1M input tokens0 regions

Context Window: 256000 tokens; Input Modalities: text

Documentation Live status

UpstageService details

Offering

Upstage Solar API — Enterprise LLM & Document AI

Offering details

Usage-based$0.0001 per 1K tokens (Solar Mini)0 regions

Solar LLM: 10.7B parameter, top leaderboard; Document Parse API: Structured data extraction; +3 more

Documentation Live status

VercelService details

Offering

Vercel AI SDK & Inference

Offering details

FreemiumFree0 regions

Unified Streaming API: 20+ AI providers; AI Gateway: Multi-provider routing; +3 more

Documentation Live status

vLLMService details

Offering

vLLM — High-Throughput LLM Inference Engine

Offering details

Open sourceFree0 regions

PagedAttention: Near 100% KV cache utilization; Throughput: 2-24x vs HuggingFace Transformers; +3 more

Documentation

WhyLabsService details

Offering

WhyLabs LLM Monitoring

Offering details

FreemiumFree0 regions

Prompt Injection: Real-time detection; Toxicity Detection: Content safety scoring; +3 more

Documentation Live status

WriterService details

Offering

Writer — Full-Stack Enterprise Generative AI

Offering details

Subscription$18 per user per month0 regions

Palmyra LLM: Enterprise-tuned LLM family; Knowledge Graph: Structured enterprise knowledge; +3 more

Documentation Live status

WriterService details

Offering

Palmyra X5

Offering details

Pay-as-you-go$0.600 1M input tokens0 regions

Context Window: 1040000 tokens; Input Modalities: text

Documentation Live status

WritesonicService details

Offering

Writesonic — AI Writing & SEO Platform

Offering details

FreemiumFree0 regions

Chatsonic: ChatGPT alternative with web search; Content Templates: 100+ templates; +3 more

Documentation Live status

xAIService details

Offering

xAI API (Grok Models)

Offering details

Usage-based$0.0002 per 1K input tokens (Grok-2-Mini)0 regions

Real-Time Data: X (Twitter) integration; Context Window: 128K-131K tokens; +3 more

Documentation Live status

xAIService details

Offering

Grok (xAI)

Offering details

Usage-based$0.000 per input token (grok-4-1-fast)0 regions

Real-time X Data: true; Context Window: 131K tokens; +3 more

Documentation Live status

xAIService details

Offering

Grok 3

Offering details

Pay-as-you-go$3 1M input tokens0 regions

Context Window: 131072 tokens; Input Modalities: text

Documentation Live status

xAIService details

Offering

Grok 3 Beta

Offering details

Pay-as-you-go$3 1M input tokens0 regions

Context Window: 131072 tokens; Input Modalities: text

Documentation Live status

xAIService details

Offering

Grok 3 Mini

Offering details

Pay-as-you-go$0.300 1M input tokens0 regions

Context Window: 131072 tokens; Input Modalities: text

Documentation Live status

xAIService details

Offering

Grok 3 Mini Beta

Offering details

Pay-as-you-go$0.300 1M input tokens0 regions

Context Window: 131072 tokens; Input Modalities: text

Documentation Live status

xAIService details

Offering

Grok 4

Offering details

Pay-as-you-go$3 1M input tokens0 regions

Context Window: 256000 tokens; Input Modalities: image, text, file

Documentation Live status

xAIService details

Offering

Grok 4.1 Fast

Offering details

Pay-as-you-go$0.200 1M input tokens0 regions

Context Window: 2000000 tokens; Input Modalities: text, image, file

Documentation Live status

xAIService details

Offering

Grok 4.20

Offering details

Pay-as-you-go$2 1M input tokens0 regions

Context Window: 2000000 tokens; Input Modalities: text, image

Documentation Live status

xAIService details

Offering

Grok 4.20 Beta

Offering details

Pay-as-you-go$3 1M input tokens0 regions

Context Window: 2000000 tokens; Input Modalities: text, image

Documentation Live status

xAIService details

Offering

Grok 4.20 Multi-Agent

Offering details

Pay-as-you-go$2 1M input tokens0 regions

Context Window: 2000000 tokens; Input Modalities: text, image, file

Documentation Live status

xAIService details

Offering

Grok 4 Fast

Offering details

Pay-as-you-go$0.200 1M input tokens0 regions

Context Window: 2000000 tokens; Input Modalities: text, image

Documentation Live status

xAIService details

Offering

Grok Code Fast 1

Offering details

Pay-as-you-go$0.200 1M input tokens0 regions

Context Window: 256000 tokens; Input Modalities: text

Documentation Live status

You.comService details

Offering

You.com — AI-Powered Search & Agentic API

Offering details

FreemiumFree0 regions

Real-Time Web Search: Cited, up-to-date answers; Model Choice: GPT-4o, Claude, Gemini (Pro); +3 more

Documentation Live status

Zhipu AIService details

Offering

Zhipu AI — ChatGLM & GLM API Platform

Offering details

Usage-based$0.0001 per 1K tokens (GLM-4 Flash)1 region

GLM-4 Model Family: Bilingual Chinese-English LLM; GLM-4V Vision: Multimodal image understanding; +3 more

Documentation Live status

Zhipu AIService details

Offering

GLM 4 32B

Offering details

Pay-as-you-go$0.100 1M input tokens0 regions

Context Window: 128000 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 4.5

Offering details

Pay-as-you-go$0.600 1M input tokens0 regions

Context Window: 131072 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 4.5 Air

Offering details

Pay-as-you-go$0.130 1M input tokens0 regions

Context Window: 131072 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 4.5 Air

Offering details

FreePrice pending0 regions

Context Window: 131072 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 4.5V

Offering details

Pay-as-you-go$0.600 1M input tokens0 regions

Context Window: 65536 tokens; Input Modalities: text, image

Documentation Live status

Zhipu AIService details

Offering

GLM 4.6

Offering details

Pay-as-you-go$0.390 1M input tokens0 regions

Context Window: 204800 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 4.6V

Offering details

Pay-as-you-go$0.300 1M input tokens0 regions

Context Window: 131072 tokens; Input Modalities: image, text, video

Documentation Live status

Zhipu AIService details

Offering

GLM 4.7

Offering details

Pay-as-you-go$0.390 1M input tokens0 regions

Context Window: 202752 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 4.7 Flash

Offering details

Pay-as-you-go$0.060 1M input tokens0 regions

Context Window: 202752 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 5

Offering details

Pay-as-you-go$0.720 1M input tokens0 regions

Context Window: 80000 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 5 Turbo

Offering details

Pay-as-you-go$1.20 1M input tokens0 regions

Context Window: 202752 tokens; Input Modalities: text

Documentation Live status

Zhipu AIService details

Offering

GLM 5V Turbo

Offering details

Pay-as-you-go$1.20 1M input tokens0 regions

Context Window: 202752 tokens; Input Modalities: image, text, video

Documentation Live status

Offering rows for AI Inference
Service	Offering	Pricing model	Starting price	Regions	Features	Links
Tencent CloudService details	Tencent Cloud AI — NLP, Vision & LLM APIs Offering details	Usage-based	$0.0008 per 1000 tokens (Hunyuan Lite)	5	Hunyuan LLM: Bilingual Chinese-English LLM; Computer Vision: Face, OCR, image recognition; +3 more	Documentation Live status
TenstorrentService details	Tenstorrent AI Inference Cloud Offering details	Usage-based	$0.500 per hour (Wormhole card)	1	LLM Inference: Cost-efficient token generation; Open Software Stack: TT-Buda inference framework; +1 more	Documentation Live status
Together AIService details	Together AI — Open-Source Model Inference Platform Offering details	Usage-based	$0.0001 per 1M tokens (Llama 3.2 8B)	2	Model Catalog: 100+ open-source models; Serverless Inference: Pay-per-token pricing; +3 more	Documentation Live status
Together AIService details	DeepSeek V3.1 on Together AI Offering details	Pay-as-you-go	$0.600 1M input tokens	0	Context Window: 128000 tokens; Input Modalities: text	Documentation Live status
Together AIService details	GLM-5 on Together AI Offering details	Pay-as-you-go	$1 1M input tokens	0	Context Window: 202752 tokens; Input Modalities: text	Documentation Live status
Together AIService details	GPT-OSS 120B on Together AI Offering details	Pay-as-you-go	$0.150 1M input tokens	0	Context Window: 128000 tokens; Input Modalities: text	Documentation Live status
Together AIService details	GPT-OSS 20B on Together AI Offering details	Pay-as-you-go	$0.050 1M input tokens	0	Context Window: 128000 tokens; Input Modalities: text	Documentation Live status
Together AIService details	Kimi K2.5 on Together AI Offering details	Pay-as-you-go	$0.500 1M input tokens	0	Context Window: 256000 tokens; Input Modalities: text, image	Documentation Live status
Together AIService details	Llama 4 Maverick on Together AI Offering details	Pay-as-you-go	$0.270 1M input tokens	0	Context Window: 524288 tokens; Input Modalities: text, image	Documentation Live status
Together AIService details	Qwen3.5 397B on Together AI Offering details	Pay-as-you-go	$0.600 1M input tokens	0	Context Window: 262144 tokens; Input Modalities: text	Documentation Live status
Together AIService details	Qwen3 Coder 480B on Together AI Offering details	Pay-as-you-go	$2 1M input tokens	0	Context Window: 256000 tokens; Input Modalities: text	Documentation Live status
UpstageService details	Upstage Solar API — Enterprise LLM & Document AI Offering details	Usage-based	$0.0001 per 1K tokens (Solar Mini)	0	Solar LLM: 10.7B parameter, top leaderboard; Document Parse API: Structured data extraction; +3 more	Documentation Live status
VercelService details	Vercel AI SDK & Inference Offering details	Freemium	Free	0	Unified Streaming API: 20+ AI providers; AI Gateway: Multi-provider routing; +3 more	Documentation Live status
vLLMService details	vLLM — High-Throughput LLM Inference Engine Offering details	Open source	Free	0	PagedAttention: Near 100% KV cache utilization; Throughput: 2-24x vs HuggingFace Transformers; +3 more	Documentation
WhyLabsService details	WhyLabs LLM Monitoring Offering details	Freemium	Free	0	Prompt Injection: Real-time detection; Toxicity Detection: Content safety scoring; +3 more	Documentation Live status
WriterService details	Writer — Full-Stack Enterprise Generative AI Offering details	Subscription	$18 per user per month	0	Palmyra LLM: Enterprise-tuned LLM family; Knowledge Graph: Structured enterprise knowledge; +3 more	Documentation Live status
WriterService details	Palmyra X5 Offering details	Pay-as-you-go	$0.600 1M input tokens	0	Context Window: 1040000 tokens; Input Modalities: text	Documentation Live status
WritesonicService details	Writesonic — AI Writing & SEO Platform Offering details	Freemium	Free	0	Chatsonic: ChatGPT alternative with web search; Content Templates: 100+ templates; +3 more	Documentation Live status
xAIService details	xAI API (Grok Models) Offering details	Usage-based	$0.0002 per 1K input tokens (Grok-2-Mini)	0	Real-Time Data: X (Twitter) integration; Context Window: 128K-131K tokens; +3 more	Documentation Live status
xAIService details	Grok (xAI) Offering details	Usage-based	$0.000 per input token (grok-4-1-fast)	0	Real-time X Data: true; Context Window: 131K tokens; +3 more	Documentation Live status
xAIService details	Grok 3 Offering details	Pay-as-you-go	$3 1M input tokens	0	Context Window: 131072 tokens; Input Modalities: text	Documentation Live status
xAIService details	Grok 3 Beta Offering details	Pay-as-you-go	$3 1M input tokens	0	Context Window: 131072 tokens; Input Modalities: text	Documentation Live status
xAIService details	Grok 3 Mini Offering details	Pay-as-you-go	$0.300 1M input tokens	0	Context Window: 131072 tokens; Input Modalities: text	Documentation Live status
xAIService details	Grok 3 Mini Beta Offering details	Pay-as-you-go	$0.300 1M input tokens	0	Context Window: 131072 tokens; Input Modalities: text	Documentation Live status
xAIService details	Grok 4 Offering details	Pay-as-you-go	$3 1M input tokens	0	Context Window: 256000 tokens; Input Modalities: image, text, file	Documentation Live status
xAIService details	Grok 4.1 Fast Offering details	Pay-as-you-go	$0.200 1M input tokens	0	Context Window: 2000000 tokens; Input Modalities: text, image, file	Documentation Live status
xAIService details	Grok 4.20 Offering details	Pay-as-you-go	$2 1M input tokens	0	Context Window: 2000000 tokens; Input Modalities: text, image	Documentation Live status
xAIService details	Grok 4.20 Beta Offering details	Pay-as-you-go	$3 1M input tokens	0	Context Window: 2000000 tokens; Input Modalities: text, image	Documentation Live status
xAIService details	Grok 4.20 Multi-Agent Offering details	Pay-as-you-go	$2 1M input tokens	0	Context Window: 2000000 tokens; Input Modalities: text, image, file	Documentation Live status
xAIService details	Grok 4 Fast Offering details	Pay-as-you-go	$0.200 1M input tokens	0	Context Window: 2000000 tokens; Input Modalities: text, image	Documentation Live status
xAIService details	Grok Code Fast 1 Offering details	Pay-as-you-go	$0.200 1M input tokens	0	Context Window: 256000 tokens; Input Modalities: text	Documentation Live status
You.comService details	You.com — AI-Powered Search & Agentic API Offering details	Freemium	Free	0	Real-Time Web Search: Cited, up-to-date answers; Model Choice: GPT-4o, Claude, Gemini (Pro); +3 more	Documentation Live status
Zhipu AIService details	Zhipu AI — ChatGLM & GLM API Platform Offering details	Usage-based	$0.0001 per 1K tokens (GLM-4 Flash)	1	GLM-4 Model Family: Bilingual Chinese-English LLM; GLM-4V Vision: Multimodal image understanding; +3 more	Documentation Live status
Zhipu AIService details	GLM 4 32B Offering details	Pay-as-you-go	$0.100 1M input tokens	0	Context Window: 128000 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 4.5 Offering details	Pay-as-you-go	$0.600 1M input tokens	0	Context Window: 131072 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 4.5 Air Offering details	Pay-as-you-go	$0.130 1M input tokens	0	Context Window: 131072 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 4.5 Air Offering details	Free	—	0	Context Window: 131072 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 4.5V Offering details	Pay-as-you-go	$0.600 1M input tokens	0	Context Window: 65536 tokens; Input Modalities: text, image	Documentation Live status
Zhipu AIService details	GLM 4.6 Offering details	Pay-as-you-go	$0.390 1M input tokens	0	Context Window: 204800 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 4.6V Offering details	Pay-as-you-go	$0.300 1M input tokens	0	Context Window: 131072 tokens; Input Modalities: image, text, video	Documentation Live status
Zhipu AIService details	GLM 4.7 Offering details	Pay-as-you-go	$0.390 1M input tokens	0	Context Window: 202752 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 4.7 Flash Offering details	Pay-as-you-go	$0.060 1M input tokens	0	Context Window: 202752 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 5 Offering details	Pay-as-you-go	$0.720 1M input tokens	0	Context Window: 80000 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 5 Turbo Offering details	Pay-as-you-go	$1.20 1M input tokens	0	Context Window: 202752 tokens; Input Modalities: text	Documentation Live status
Zhipu AIService details	GLM 5V Turbo Offering details	Pay-as-you-go	$1.20 1M input tokens	0	Context Window: 202752 tokens; Input Modalities: image, text, video	Documentation Live status

Showing 451–495 of 495 offerings