</>SnippetsLabBuild faster with production-ready snippets

pythonintermediate

OpenAI Streaming with SSE in FastAPI

Stream OpenAI responses as Server-Sent Events from a FastAPI endpoint.

pythonPress ⌘/Ctrl + Shift + C to copy

from fastapi import FastAPI
from fastapi.responses import StreamingResponse
from openai import AsyncOpenAI

app   = FastAPI()
client = AsyncOpenAI()

async def stream_llm(prompt: str):
    stream = await client.chat.completions.create(
        model='gpt-4o-mini',
        messages=[{'role':'user','content':prompt}],
        stream=True,
    )
    async for chunk in stream:
        delta = chunk.choices[0].delta.content
        if delta:
            yield f'data: {delta}\n\n'
    yield 'data: [DONE]\n\n'

@app.get('/chat')
async def chat(prompt: str = 'Hello!'):
    return StreamingResponse(stream_llm(prompt), media_type='text/event-stream')

Use Cases

streaming AI APIs
real-time responses
SSE endpoints

Tags

#openai #fastapi #streaming #sse

Related Snippets

Similar patterns you can reuse in the same workflow.

typescriptintermediate

OpenAI Chat Completion with Streaming

Stream GPT responses token-by-token using the OpenAI SDK with async iteration.

Best for: chatbot UI

#openai#streaming

typescriptintermediate

Next.js AI Streaming Route Handler

Stream OpenAI responses from a Next.js App Router route handler using the Vercel AI SDK.

Best for: AI chatbot backend

Stream LLM Chat Responses

Stream OpenAI chat completions token-by-token for real-time UI updates.

Best for: Chat UIs

OpenAI Realtime API WebSocket

Connect to the OpenAI Realtime API via WebSocket for low-latency voice and text streaming.

Best for: voice AI

#openai#realtime