ChatGPT —— OpenAI 旗舰 AI 助手

由 OpenAI 打造，专注通用人工智能与多模态能力。从高效对话到复杂推理，ChatGPT 覆盖写作、编程、数据分析与智能助手等全场景应用。

📌 内容摘要

流式输出让用户看到”逐字生成”而不是等待完整响应，是 AI 产品用户体验的关键设计。
本文覆盖完整的全链路实现：Claude API 流式调用 → Python/Node.js 后端代理 → React/原生 JS 前端渲染。
重点解决生产中最常见的三个问题：Nginx 缓冲导致流不出来、断线重连、并发流式连接的资源管理。
附 EventSource vs fetch+ReadableStream 两种前端方案对比，以及移动端的注意事项。

一、流式输出的工作原理

理解流式输出之前，先理解 SSE（Server-Sent Events）协议——这是 Claude 流式输出的底层传输机制。

SSE 是一种 HTTP 长连接协议：客户端发起一个普通 HTTP 请求，服务器不立刻关闭连接，而是持续向客户端推送数据。每条数据以 data: 内容\n\n 格式发送。连接由服务器关闭或客户端主动断开。

Claude 流式输出的完整数据流：

客户端                    你的后端                   Claude API
  │                          │                           │
  │──── POST /chat/stream ──►│                           │
  │                          │──── messages.stream() ──►│
  │                          │                           │
  │◄── data: {"type":"text"} │◄── event: text_delta ────│
  │◄── data: {"type":"text"} │◄── event: text_delta ────│
  │◄── data: {"type":"text"} │◄── event: text_delta ────│
  │◄── data: {"type":"done"} │◄── event: message_stop ──│
  │                          │                           │
  │(关闭连接)                 │(关闭连接)                  │

⚠️ 为什么不直接让前端调 Claude API？
不能把 Anthropic API Key 暴露给前端——任何人都能从浏览器 DevTools 里看到它。正确架构是：前端 → 你的后端（持有 API Key）→ Claude API。你的后端充当代理，把 Claude 的流式响应转发给前端。

二、Python 后端流式代理

2.1 FastAPI 基础流式接口

import anthropic
import json
import asyncio
from fastapi import FastAPI, HTTPException
from fastapi.responses import StreamingResponse
from fastapi.middleware.cors import CORSMiddleware
from pydantic import BaseModel
from typing import Optional, AsyncGenerator

app    = FastAPI()
client = anthropic.AsyncAnthropic()

app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_methods=["POST", "GET"],
    allow_headers=["*"],
)

class ChatRequest(BaseModel):
    message:     str
    system:      Optional[str]   = None
    model:       Optional[str]   = "claude-sonnet-4-6"
    max_tokens:  Optional[int]   = 2048
    temperature: Optional[float] = None


async def claude_stream_generator(
    request: ChatRequest,
) -> AsyncGenerator[str, None]:
    """
    核心生成器：从 Claude API 获取流，转换为 SSE 格式发给前端

    SSE 格式要求：
    - 每条消息以 "data: " 开头
    - 每条消息以 "\n\n" 结尾
    - 可以有多行的消息，用 "\n" 分隔，最后 "\n\n" 结束
    """

    kwargs = dict(
        model      = request.model,
        max_tokens = request.max_tokens,
        system     = request.system or "你是一个专业的 AI 助手，回答简洁准确。",
        messages   = [{"role": "user", "content": request.message}],
    )
    if request.temperature is not None:
        kwargs["temperature"] = request.temperature

    try:
        async with client.messages.stream(**kwargs) as stream:
            # 发送开始事件
            yield f"data: {json.dumps({'type': 'start', 'model': request.model})}\n\n"

            # 逐块发送文本
            async for text in stream.text_stream:
                payload = json.dumps({"type": "text", "data": text}, ensure_ascii=False)
                yield f"data: {payload}\n\n"

            # 流结束：发送用量统计
            final   = await stream.get_final_message()
            usage   = {
                "input":       final.usage.input_tokens,
                "output":      final.usage.output_tokens,
                "stop_reason": final.stop_reason,
            }
            yield f"data: {json.dumps({'type': 'usage', 'data': usage})}\n\n"
            yield f"data: {json.dumps({'type': 'done'})}\n\n"

    except anthropic.RateLimitError:
        error_payload = json.dumps({"type": "error", "code": 429, "message": "API 速率限制，请稍后重试"})
        yield f"data: {error_payload}\n\n"

    except anthropic.APIStatusError as e:
        error_payload = json.dumps({"type": "error", "code": e.status_code, "message": str(e.message)})
        yield f"data: {error_payload}\n\n"

    except asyncio.CancelledError:
        # 客户端主动断开连接（正常情况，不需要报错）
        pass

    except Exception as e:
        error_payload = json.dumps({"type": "error", "code": 500, "message": "服务器内部错误"})
        yield f"data: {error_payload}\n\n"


@app.post("/api/chat/stream")
async def chat_stream(request: ChatRequest):
    return StreamingResponse(
        claude_stream_generator(request),
        media_type="text/event-stream",
        headers={
            "Cache-Control":              "no-cache",
            "X-Accel-Buffering":          "no",       # 关键：告诉 Nginx 不要缓冲
            "Access-Control-Allow-Origin":"*",
            "Connection":                 "keep-alive",
        },
    )


# 普通（非流式）接口，方便对比
@app.post("/api/chat")
async def chat(request: ChatRequest):
    try:
        response = await client.messages.create(
            model      = request.model,
            max_tokens = request.max_tokens,
            system     = request.system or "你是一个专业的 AI 助手。",
            messages   = [{"role": "user", "content": request.message}],
        )
        return {
            "content":       response.content[0].text,
            "input_tokens":  response.usage.input_tokens,
            "output_tokens": response.usage.output_tokens,
        }
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

2.2 多轮对话的流式接口

from collections import defaultdict

# 内存会话存储（生产环境用 Redis）
_sessions: dict[str, list[dict]] = defaultdict(list)

class MultiTurnRequest(BaseModel):
    message:    str
    session_id: str
    system:     Optional[str] = None


async def multi_turn_stream_generator(
    request: MultiTurnRequest,
) -> AsyncGenerator[str, None]:
    """多轮对话流式生成器"""
    history = _sessions[request.session_id]

    # 追加用户消息
    history.append({"role": "user", "content": request.message})

    # 控制历史长度（最多保留20条）
    if len(history) > 20:
        history = history[-20:]
        _sessions[request.session_id] = history

    full_response = []

    try:
        async with client.messages.stream(
            model      = "claude-sonnet-4-6",
            max_tokens = 2048,
            system     = request.system or "你是一个专业的 AI 助手。",
            messages   = history,
        ) as stream:
            yield f"data: {json.dumps({'type': 'start', 'session_id': request.session_id})}\n\n"

            async for text in stream.text_stream:
                full_response.append(text)
                payload = json.dumps({"type": "text", "data": text}, ensure_ascii=False)
                yield f"data: {payload}\n\n"

            # 流结束后把 assistant 回复存入历史
            assistant_content = "".join(full_response)
            history.append({"role": "assistant", "content": assistant_content})

            yield f"data: {json.dumps({'type': 'done', 'session_id': request.session_id})}\n\n"

    except asyncio.CancelledError:
        # 客户端断开，但我们仍然要把已有的回复存入历史
        if full_response:
            assistant_content = "".join(full_response) + "（已中断）"
            history.append({"role": "assistant", "content": assistant_content})

    except Exception as e:
        yield f"data: {json.dumps({'type': 'error', 'message': str(e)})}\n\n"


@app.post("/api/chat/multi-stream")
async def multi_turn_stream(request: MultiTurnRequest):
    return StreamingResponse(
        multi_turn_stream_generator(request),
        media_type="text/event-stream",
        headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no"},
    )

三、Node.js/TypeScript 后端流式代理

// server.ts
import Anthropic from "@anthropic-ai/sdk";
import express, { Request, Response } from "express";
import cors from "cors";

const app    = express();
const claude = new Anthropic();

app.use(cors());
app.use(express.json());


app.post("/api/chat/stream", async (req: Request, res: Response) => {
  const { message, system, model = "claude-sonnet-4-6", maxTokens = 2048 } = req.body;

  if (!message) {
    return res.status(400).json({ error: "message 不能为空" });
  }

  // 设置 SSE 响应头
  res.setHeader("Content-Type",               "text/event-stream");
  res.setHeader("Cache-Control",              "no-cache");
  res.setHeader("X-Accel-Buffering",          "no");        // 禁用 Nginx 缓冲
  res.setHeader("Access-Control-Allow-Origin","*");
  res.setHeader("Connection",                 "keep-alive");
  res.flushHeaders();    // 立即发送头部，建立长连接

  // 发送辅助函数
  const sendEvent = (data: object) => {
    res.write(`data: ${JSON.stringify(data)}\n\n`);
  };

  // 监听客户端断开
  let isClosed = false;
  req.on("close", () => { isClosed = true; });

  try {
    sendEvent({ type: "start", model });

    const stream = await claude.messages.stream({
      model,
      max_tokens: maxTokens,
      system:     system || "你是一个专业的 AI 助手。",
      messages:   [{ role: "user", content: message }],
    });

    for await (const chunk of stream) {
      if (isClosed) break;    // 客户端断开，停止生成

      if (
        chunk.type === "content_block_delta" &&
        chunk.delta.type === "text_delta"
      ) {
        sendEvent({ type: "text", data: chunk.delta.text });
      }
    }

    if (!isClosed) {
      const finalMsg = await stream.finalMessage();
      sendEvent({
        type:  "usage",
        data:  {
          input:        finalMsg.usage.input_tokens,
          output:       finalMsg.usage.output_tokens,
          stop_reason:  finalMsg.stop_reason,
        },
      });
      sendEvent({ type: "done" });
    }

  } catch (error: any) {
    if (!isClosed) {
      if (error.status === 429) {
        sendEvent({ type: "error", code: 429, message: "速率限制，请稍后重试" });
      } else {
        sendEvent({ type: "error", code: error.status || 500, message: error.message });
      }
    }
  } finally {
    if (!isClosed) {
      res.end();
    }
  }
});


// 健康检查
app.get("/health", (_, res) => res.json({ status: "ok" }));

app.listen(3001, () => console.log("服务启动：http://localhost:3001"));

四、前端实现：fetch + ReadableStream（推荐）

fetch + ReadableStream 是现代浏览器中处理流的最灵活方式，支持 POST 请求（EventSource 只支持 GET）：

// 原生 JS 版本，可在任何框架中使用

async function* readSSEStream(response) {
  /**
   * 把 Response body 解析为 SSE 事件流
   * 返回一个异步生成器，每次 yield 一个解析后的事件对象
   */
  const reader  = response.body.getReader();
  const decoder = new TextDecoder();
  let   buffer  = "";

  try {
    while (true) {
      const { done, value } = await reader.read();
      if (done) break;

      buffer += decoder.decode(value, { stream: true });

      // SSE 协议：每个事件以 \n\n 分隔
      const lines = buffer.split("\n\n");
      buffer = lines.pop() ?? "";   // 最后一段可能不完整，留到下次

      for (const line of lines) {
        if (!line.trim()) continue;

        // 一个 SSE 事件可能有多行（event:、data:、id: 等）
        // 我们只处理 data: 行
        for (const part of line.split("\n")) {
          if (part.startsWith("data: ")) {
            try {
              yield JSON.parse(part.slice(6));
            } catch {
              yield { type: "raw", data: part.slice(6) };
            }
          }
        }
      }
    }
  } finally {
    reader.releaseLock();
  }
}


async function streamChat({
  message,
  system     = "",
  onText,    // (text: string) => void
  onDone,    // (usage: object) => void
  onError,   // (error: object) => void
  signal,    // AbortSignal（用于取消）
}) {
  /**
   * 调用流式接口的完整封装
   *
   * 用法：
   * const controller = new AbortController();
   * await streamChat({
   *   message: "你好",
   *   onText:  (t) => console.log(t),
   *   onDone:  (u) => console.log("完成", u),
   *   signal:  controller.signal,
   * });
   * // 中途取消：controller.abort();
   */

  let response;
  try {
    response = await fetch("/api/chat/stream", {
      method:  "POST",
      headers: { "Content-Type": "application/json" },
      body:    JSON.stringify({ message, system }),
      signal,    // 支持 AbortController 取消
    });
  } catch (err) {
    if (err.name === "AbortError") return;
    onError?.({ code: 0, message: "网络连接失败" });
    return;
  }

  if (!response.ok) {
    onError?.({ code: response.status, message: `HTTP ${response.status}` });
    return;
  }

  let usageData = null;

  for await (const event of readSSEStream(response)) {
    if (signal?.aborted) break;

    switch (event.type) {
      case "text":
        onText?.(event.data);
        break;

      case "usage":
        usageData = event.data;
        break;

      case "done":
        onDone?.(usageData);
        break;

      case "error":
        onError?.(event);
        return;
    }
  }
}

五、React 完整组件

import { useState, useRef, useEffect, useCallback } from "react";

// 复用上面的 streamChat 和 readSSEStream 函数

function ChatMessage({ role, content, isStreaming }) {
  return (
    
      
        {content}
        {isStreaming && (
          
        )}
      
    
  );
}


export default function StreamingChat() {
  const [messages,    setMessages]    = useState([]);
  const [input,       setInput]       = useState("");
  const [isStreaming, setIsStreaming] = useState(false);
  const [usage,       setUsage]       = useState(null);
  const [error,       setError]       = useState("");

  const abortRef  = useRef(null);     // 存储 AbortController
  const bottomRef = useRef(null);     // 自动滚动到底部


  // 自动滚动
  useEffect(() => {
    bottomRef.current?.scrollIntoView({ behavior: "smooth" });
  }, [messages]);


  const send = useCallback(async () => {
    const text = input.trim();
    if (!text || isStreaming) return;

    setInput("");
    setError("");
    setUsage(null);

    // 添加用户消息
    setMessages(prev => [...prev, { role: "user", content: text, id: Date.now() }]);

    // 添加空的 assistant 消息（即将被流填充）
    const assistantId = Date.now() + 1;
    setMessages(prev => [...prev, { role: "assistant", content: "", id: assistantId, streaming: true }]);

    setIsStreaming(true);

    // 创建 AbortController
    const controller = new AbortController();
    abortRef.current = controller;

    await streamChat({
      message: text,
      signal:  controller.signal,

      onText(chunk) {
        setMessages(prev =>
          prev.map(msg =>
            msg.id === assistantId
              ? { ...msg, content: msg.content + chunk }
              : msg
          )
        );
      },

      onDone(usageData) {
        setMessages(prev =>
          prev.map(msg =>
            msg.id === assistantId
              ? { ...msg, streaming: false }
              : msg
          )
        );
        setUsage(usageData);
        setIsStreaming(false);
      },

      onError(err) {
        setMessages(prev =>
          prev.map(msg =>
            msg.id === assistantId
              ? { ...msg, content: "（生成失败，请重试）", streaming: false }
              : msg
          )
        );
        setError(`错误 ${err.code}：${err.message}`);
        setIsStreaming(false);
      },
    });
  }, [input, isStreaming]);


  const stop = useCallback(() => {
    abortRef.current?.abort();
    setIsStreaming(false);
    // 标记当前流式消息为已停止
    setMessages(prev =>
      prev.map(msg =>
        msg.streaming ? { ...msg, streaming: false, content: msg.content + "…（已停止）" } : msg
      )
    );
  }, []);


  return (
    
      

      {/* 消息列表 */}
      
        {messages.length === 0 && (
          
            发送消息开始对话
          
        )}
        {messages.map(msg => (
          
        ))}
        
      

      {/* 错误提示 */}
      {error && (
        
          ⚠️ {error}
        
      )}

      {/* 用量统计 */}
      {usage && !isStreaming && (
        
          输入 {usage.input} tokens · 输出 {usage.output} tokens
        
      )}

      {/* 输入区 */}
      
         setInput(e.target.value)}
          onKeyDown={e => { if (e.key === "Enter" && !e.shiftKey) { e.preventDefault(); send(); } }}
          placeholder="输入消息... (Enter 发送，Shift+Enter 换行)"
          disabled={isStreaming}
          rows={3}
          style={{
            flex:        1,
            padding:     "8px 12px",
            border:      "1px solid #ddd",
            borderRadius:"8px",
            resize:      "none",
            fontSize:    "14px",
            outline:     "none",
          }}
        />
        {isStreaming ? (
          <button onClick={stop} style={{ padding: "0 16px", background: "#dc2626", color: "#fff", border: "none", borderRadius: "8px", cursor: "pointer" }}>
            停止
          </button>
        ) : (
          <button onClick={send} disabled={!input.trim()} style={{ padding: "0 16px", background: "#1a6b6b", color: "#fff", border: "none", borderRadius: "8px", cursor: "pointer", opacity: input.trim() ? 1 : 0.5 }}>
            发送
          </button>
        )}
      </div>
    </div>
  );
}</pre>
<h2>六、EventSource 方案（GET 请求）</h2>
<p>EventSource API 是浏览器原生的 SSE 支持，但只支持 GET 请求。适合只需要传少量参数的场景：</p>
<pre style="background:#1a1208;color:#e8dcc8;padding:16px 18px;border-radius:6px;font-size:13px;line-height:1.7;border-left:3px solid #1a6b6b;overflow-x:auto;">// EventSource 方案（GET 请求，参数通过 query string 传递）

// 后端接口
@app.get("/api/chat/stream-get")
async def chat_stream_get(message: str, model: str = "claude-sonnet-4-6"):
    return StreamingResponse(
        claude_stream_generator(ChatRequest(message=message, model=model)),
        media_type="text/event-stream",
        headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no"},
    )


// 前端使用
function useEventSourceStream(message) {
  const [output, setOutput] = useState("");
  const [done,   setDone]   = useState(false);
  const esRef = useRef(null);

  const start = useCallback((msg) => {
    // 关闭已有连接
    esRef.current?.close();

    setOutput("");
    setDone(false);

    const params = new URLSearchParams({ message: msg });
    const es     = new EventSource(`/api/chat/stream-get?${params}`);
    esRef.current = es;

    es.onmessage = (event) => {
      const data = JSON.parse(event.data);
      if (data.type === "text") {
        setOutput(prev => prev + data.data);
      } else if (data.type === "done") {
        setDone(true);
        es.close();
      } else if (data.type === "error") {
        console.error("流式错误：", data);
        es.close();
      }
    };

    es.onerror = () => {
      console.error("EventSource 连接错误");
      es.close();
    };
  }, []);

  const stop = useCallback(() => {
    esRef.current?.close();
    setDone(true);
  }, []);

  return { output, done, start, stop };
}</pre>
<table style="width:100%;border-collapse:collapse;font-size:14px;margin:12px 0 24px;">
<thead>
<tr style="background:#1a1208;color:#fff;">
<th style="padding:9px 13px;text-align:left;">方案</th>
<th style="padding:9px 13px;text-align:left;">请求方式</th>
<th style="padding:9px 13px;text-align:left;">优点</th>
<th style="padding:9px 13px;text-align:left;">缺点</th>
</tr>
</thead>
<tbody>
<tr>
<td style="padding:9px 13px;border-bottom:1px solid #eee;font-weight:500">fetch + ReadableStream</td>
<td style="padding:9px 13px;border-bottom:1px solid #eee;">GET / POST</td>
<td style="padding:9px 13px;border-bottom:1px solid #eee;">支持 POST、可传复杂 body、支持 AbortController</td>
<td style="padding:9px 13px;border-bottom:1px solid #eee;">需要手动解析 SSE 格式</td>
</tr>
<tr style="background:#f9f7f4;">
<td style="padding:9px 13px;font-weight:500">EventSource</td>
<td style="padding:9px 13px;">仅 GET</td>
<td style="padding:9px 13px;">浏览器原生支持、自动重连</td>
<td style="padding:9px 13px;">只支持 GET、参数只能放 URL、无法自定义请求头</td>
</tr>
</tbody>
</table>
<p><strong>推荐使用 fetch + ReadableStream</strong>——灵活性更高，支持 POST 传复杂参数（如对话历史），且支持 AbortController 取消。</p>
<h2>七、Nginx 配置（关键细节）</h2>
<pre style="background:#1a1208;color:#e8dcc8;padding:16px 18px;border-radius:6px;font-size:13px;line-height:1.7;border-left:3px solid #1a6b6b;overflow-x:auto;"># /etc/nginx/sites-enabled/your-app.conf

upstream api_backend {
    server 127.0.0.1:8000;
}

server {
    listen 80;
    server_name your-domain.com;

    # ── 流式接口的专属配置 ─────────────────────────
    location ~ ^/api/chat/(stream|multi-stream) {
        proxy_pass         http://api_backend;
        proxy_http_version 1.1;

        # 关闭连接升级头（SSE 不需要 WebSocket 升级）
        proxy_set_header   Upgrade    "";
        proxy_set_header   Connection "";

        # ⚠️ 这三行是让流式输出正常工作的关键
        proxy_buffering    off;         # 关闭 Nginx 缓冲（最重要）
        proxy_cache        off;         # 关闭缓存
        proxy_read_timeout 300s;        # 流式连接需要更长的超时

        proxy_set_header   Host              $host;
        proxy_set_header   X-Real-IP         $remote_addr;
        proxy_set_header   X-Forwarded-For   $proxy_add_x_forwarded_for;

        # gzip 压缩对 SSE 没用，且可能导致问题
        gzip off;
    }

    # ── 普通接口 ───────────────────────────────────
    location /api/ {
        proxy_pass         http://api_backend;
        proxy_http_version 1.1;
        proxy_read_timeout 60s;
        proxy_set_header   Host            $host;
        proxy_set_header   X-Real-IP       $remote_addr;
    }

    # ── 前端静态文件 ───────────────────────────────
    location / {
        root /var/www/html;
        try_files $uri $uri/ /index.html;
    }
}</pre>
<h2>八、生产级问题处理</h2>
<h3>断线重连</h3>
<pre style="background:#1a1208;color:#e8dcc8;padding:14px 18px;border-radius:6px;font-size:13px;line-height:1.7;border-left:3px solid #1a6b6b;overflow-x:auto;">async function streamWithRetry({
  message,
  onText,
  onDone,
  onError,
  maxRetries = 3,
  retryDelay = 1000,
}) {
  for (let attempt = 0; attempt <= maxRetries; attempt++) {
    try {
      await streamChat({ message, onText, onDone, onError });
      return;   // 成功，退出重试循环
    } catch (err) {
      if (attempt === maxRetries) {
        onError?.({ code: 0, message: `重试 ${maxRetries} 次后仍失败` });
        return;
      }
      const delay = retryDelay * Math.pow(2, attempt);   // 指数退避
      await new Promise(r => setTimeout(r, delay));
    }
  }
}</pre>
<h3>并发流式连接数限制</h3>
<pre style="background:#1a1208;color:#e8dcc8;padding:14px 18px;border-radius:6px;font-size:13px;line-height:1.7;border-left:3px solid #1a6b6b;overflow-x:auto;"># 后端：限制每个用户的并发流式连接数
from collections import defaultdict
import asyncio

_active_streams: dict[str, int] = defaultdict(int)
MAX_CONCURRENT_STREAMS = 3

@app.post("/api/chat/stream")
async def chat_stream(request: ChatRequest, user_id: str = "default"):
    if _active_streams[user_id] >= MAX_CONCURRENT_STREAMS:
        raise HTTPException(status_code=429, detail="并发连接数超限")

    _active_streams[user_id] += 1
    try:
        return StreamingResponse(
            claude_stream_generator(request),
            media_type="text/event-stream",
            headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no"},
        )
    finally:
        _active_streams[user_id] -= 1</pre>
<h2>常见问题</h2>
<p><strong>Q：流式输出中途中断了怎么恢复？</strong><br />
SSE 协议原生支持断点续传，通过 <code>Last-Event-ID</code> 请求头传递上次收到的事件 ID。但 Claude API 不支持从中途恢复生成——中断了就只能重新开始。实际上，大多数应用的做法是：把已生成的文本展示给用户，提供”继续”按钮，让用户手动触发继续生成。</p>
<p><strong>Q：移动端 Safari 有什么特殊注意事项？</strong><br />
Safari（尤其是 iOS）对长连接有一些限制：后台标签页会暂停连接，从后台切回时可能需要重新建立连接。建议在页面 visibility change 时检测状态，如果流式连接中断了，展示”连接已断开，点击继续”的提示，而不是默默失败。另外 Safari 对 <code>TextDecoder</code> 的 <code>stream: true</code> 参数支持从 iOS 16 开始，旧版本需要 polyfill。</p>
<p><strong>Q：流式输出时，token 用量什么时候能拿到？</strong><br />
流结束之后——整个响应生成完毕，Claude 才会返回 <code>usage</code> 信息。在本文的实现里，用量通过 <code>type: "usage"</code> 事件在 <code>type: "done"</code> 之前发给前端。如果需要在流式过程中实时估算成本，可以用规则近似计算：输入 token 数在请求开始时可以预估（1个英文单词≈1.3 token，1个汉字≈0.7 token），输出 token 数则按生成的字符数实时估算。</p>
<h2>总结</h2>
<p>流式输出全链路的关键点总结：后端用 <code>StreamingResponse</code> + <code>AsyncGenerator</code>，每条数据必须以 <code>data: ...\n\n</code> 格式发送；Nginx 必须设置 <code>proxy_buffering off</code>，这是最容易被忽视的坑；前端推荐 fetch + ReadableStream 方案而不是 EventSource，因为支持 POST 和 AbortController；生产环境要做并发连接数限制和断线重连。四层的代码（Claude API → Python/Node.js 代理 → SSE 传输 → React 渲染）各自独立，可以按需替换其中任意一层。</p>
        </div>

        <div class="article-footer">
            <div class="article-tags">
                <span class="tag-label">标签：</span>
                                        <a href="https://www.claude-anthropic.com/tag/claude-api" class="tag-chip">claude api</a>
                                            <a href="https://www.claude-anthropic.com/tag/claude-streaming" class="tag-chip">claude streaming</a>
                                            <a href="https://www.claude-anthropic.com/tag/claude%e5%ae%98%e7%bd%91%e4%b8%ad%e6%96%87%e7%89%88" class="tag-chip">claude官网中文版</a>
                                            <a href="https://www.claude-anthropic.com/tag/claude%e6%b5%81%e5%bc%8f%e8%be%93%e5%87%ba" class="tag-chip">claude流式输出</a>
                                </div>

            <div class="author-card">
                <div class="author-avatar-lg">编</div>
                <div class="author-info">
                    <div class="author-name">Claude</div>
                    <div class="author-role">资深科技编辑</div>
                    <div class="author-bio">
                                            </div>
                </div>
            </div>

            <div class="article-nav">
                                <a href="https://www.claude-anthropic.com/guide/336.html" class="article-nav-item ">
                    <div class="nav-dir">← 上一篇</div>
                    <div class="nav-title">Claude 输出格式控制：Markdown、JSON、XML 怎么用</div>
                </a>
                <a href="https://www.claude-anthropic.com/scenario-application/366.html" class="article-nav-item next ">
                    <div class="nav-dir">下一篇 →</div>
                    <div class="nav-title">基于 Claude 的微服务 AI 网关架构设计</div>
                </a>
            </div>
        </div>
    </article>

    
<aside class="sidebar toc-sidebar">
                <div class="sidebar-widget">
                <div class="widget-title">📰 相关文章</div>
                <div class="related-list">
                                                <a href="https://www.claude-anthropic.com/news/237.html" class="related-item">
                                <div class="related-thumb">
                                                                            <img width="150" height="150" src="https://www.claude-anthropic.com/wp-content/uploads/2026/03/412e4321-80d1-4b0e-8eef-ce05da9a1b1a-150x150.jpg" class="attachment-thumbnail size-thumbnail wp-post-image" alt="" decoding="async" />                                                                    </div>
                                <div>
                                    <div class="related-title">Claude 4 系列最新资讯：Opus 4.6、Sonnet 4.6 全面盘点（2026年3月更新）</div>
                                    <div class="related-date">2026-03-22</div>
                                </div>
                            </a>
                                                    <a href="https://www.claude-anthropic.com/news/527.html" class="related-item">
                                <div class="related-thumb">
                                                                            <img width="150" height="150" src="https://www.claude-anthropic.com/wp-content/uploads/2026/03/99e99344-33fd-4a7e-8e28-4aa254ebd7b5-150x150.jpg" class="attachment-thumbnail size-thumbnail wp-post-image" alt="" decoding="async" />                                                                    </div>
                                <div>
                                    <div class="related-title">Claude 官网免费版每天能发多少条消息，额度用完了怎么办</div>
                                    <div class="related-date">2026-04-13</div>
                                </div>
                            </a>
                                                    <a href="https://www.claude-anthropic.com/news/500.html" class="related-item">
                                <div class="related-thumb">
                                                                            <img width="150" height="150" src="https://www.claude-anthropic.com/wp-content/uploads/2026/03/9ba1f524-3e93-4ddf-910e-3b27d9f713de-150x150.jpg" class="attachment-thumbnail size-thumbnail wp-post-image" alt="" decoding="async" loading="lazy" />                                                                    </div>
                                <div>
                                    <div class="related-title">OpenClaw 被封禁后创始人已加入 OpenAI，这场竞争背后发生了什么</div>
                                    <div class="related-date">2026-04-06</div>
                                </div>
                            </a>
                                                    <a href="https://www.claude-anthropic.com/news/272.html" class="related-item">
                                <div class="related-thumb">
                                                                            <img width="150" height="150" src="https://www.claude-anthropic.com/wp-content/uploads/2026/03/270fe506-9f70-4efe-bfe9-8704614c54e1-150x150.jpg" class="attachment-thumbnail size-thumbnail wp-post-image" alt="" decoding="async" loading="lazy" />                                                                    </div>
                                <div>
                                    <div class="related-title">Claude vs ChatGPT 2026：最新深度对比，谁才是你的最佳AI助手？</div>
                                    <div class="related-date">2026-03-26</div>
                                </div>
                            </a>
                                        </div>
            </div>

            <div class="sidebar-widget">
                <div class="widget-title">🏷️ 热门标签</div>
                <div class="tag-cloud">
                                                <a href="https://www.claude-anthropic.com/tag/claude%e5%ae%98%e7%bd%91%e4%b8%ad%e6%96%87%e7%89%88" class="tag-chip">claude官网中文版</a>
                                                    <a href="https://www.claude-anthropic.com/tag/claude%e4%bd%bf%e7%94%a8%e6%95%99%e7%a8%8b" class="tag-chip">claude使用教程</a>
                                                    <a href="https://www.claude-anthropic.com/tag/claude-api" class="tag-chip">claude api</a>
                                                    <a href="https://www.claude-anthropic.com/tag/claude-opus-4-6" class="tag-chip">claude opus 4.6</a>
                                                    <a href="https://www.claude-anthropic.com/tag/claude-api%e6%95%99%e7%a8%8b" class="tag-chip">claude api教程</a>
                                                    <a href="https://www.claude-anthropic.com/tag/claude-code" class="tag-chip">claude code</a>
                                                    <a href="https://www.claude-anthropic.com/tag/claude-api%e4%bb%b7%e6%a0%bc" class="tag-chip">claude api价格</a>
                                                    <a href="https://www.claude-anthropic.com/tag/claude%e4%bd%bf%e7%94%a8%e6%8a%80%e5%b7%a7" class="tag-chip">claude使用技巧</a>
                                        </div>
            </div>
            </aside></div>

<button class="back-top" id="backTop" title="返回顶部">↑</button>

<!-- 页脚 -->
<section class="seo-section">
    <div class="seo-inner">
      <div class="seo-block">
        <h3>什么是 Claude 官网中文版？</h3>
        <p>
          Claude 是由美国 AI 公司 Anthropic 开发的大型语言模型，以安全性和智能性著称。本站是专为中国用户打造的 Claude 资讯平台，提供注册指南、功能介绍、使用教程等全中文内容，帮助用户快速了解并上手 Claude AI 助手。
        </p>
      </div>
      <div class="seo-block">
        <h3>Claude 有哪些主要功能？</h3>
        <p>
          Claude 支持自然语言对话、文案写作、代码生成、数据分析、PDF文档处理、图像理解等多种功能。Claude 4 系列模型还新增了深度研究、长文本处理（200K上下文）等企业级能力，广泛应用于办公效率、学术研究、软件开发等领域。
        </p>
      </div>
      <div class="seo-block">
        <h3>中国用户如何使用 Claude？</h3>
        <p>
          中国用户可通过 Claude 官网（claude.ai）注册账号并使用。目前需要使用境外手机号进行验证。本站提供详细的注册步骤教程，以及 Claude API 接入方案，帮助开发者和企业用户将 Claude 集成到自己的产品中。
        </p>
      </div>
    </div>
  </section>
  <footer>
    <div class="footer-inner">
        <div class="footer-grid">
            <div>
                <div class="footer-brand">Claude官网</div>
                <p class="footer-desc">
                    专注于 Anthropic Claude AI 的中文资讯、教程与评测。
                </p>
            </div>
            <div class="footer-col">
                <h4>快速导航</h4>
                <ul><li id="menu-item-219" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-219"><a href="https://www.claude-anthropic.com/category/api">API指南</a></li>
<li id="menu-item-220" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-220"><a href="https://www.claude-anthropic.com/category/guide">使用教程</a></li>
<li id="menu-item-221" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-221"><a href="https://www.claude-anthropic.com/category/faq">常见问题</a></li>
<li id="menu-item-222" class="menu-item menu-item-type-taxonomy menu-item-object-category current-post-ancestor current-menu-parent current-post-parent menu-item-222"><a href="https://www.claude-anthropic.com/category/news">最新资讯</a></li>
<li id="menu-item-223" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-223"><a href="https://www.claude-anthropic.com/category/model-comparison">模型对比</a></li>
<li id="menu-item-224" class="menu-item menu-item-type-post_type menu-item-object-page menu-item-224"><a href="https://www.claude-anthropic.com/about-claude">关于Claude</a></li>
</ul>            </div>
           
            <div class="footer-col">
                <h4>友情链接</h4>
                 <ul><li id="menu-item-265" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-265"><a href="https://www.openclaaw.cn/">OpenClaw</a></li>
<li id="menu-item-266" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-266"><a href="https://www.chatgp6.com/">ChatGPT</a></li>
</ul>            </div>
        </div>
        <div class="footer-bottom">
            <span>© 2026 Claude官网 · 非官方独立媒体</span>
            <span><a href="/sitemap.xml">网站地图xml</a> · <a href="/sitemap.html">网站地图</a></span>
        </div>
    </div>
</footer>

<script type="speculationrules">
{"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/claude/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]}
</script>
<script></script><script id="claude-zh-main-js" src="https://www.claude-anthropic.com/wp-content/themes/claude/js/main.js?ver=1.0.0"></script>
</body>
</html>

Claude 流式输出 + SSE：前后端全链路实现