mirror of https://github.com/farion1231/cc-switch.git synced 2026-04-11 05:46:01 +08:00

Files

Jason bbed2a1fe1 docs: restructure user manual for i18n and add EN/JA translations

Reorganize docs/user-manual/ from flat structure to language subdirectories
(zh/, en/, ja/) with shared assets/. Move existing Chinese docs into zh/,
fix image paths, add multilingual navigation README, and translate all 23
markdown files (~4500 lines each) to English and Japanese.

2026-03-03 08:40:52 +08:00

3.6 KiB

Raw Blame History

4.5 模型检查

功能说明

模型检查功能用于验证供应商配置的模型是否可用，通过发送实际的 API 请求来测试：

模型是否存在
API Key 是否有效
端点是否正常响应
响应延迟是否正常

打开配置

设置 → 高级 → 模型测试

测试模型配置

为每个应用配置用于测试的模型：

应用	配置项	默认值	说明
Claude	Claude 模型	系统默认	建议使用 Haiku 系列（成本低、速度快）
Codex	Codex 模型	系统默认	建议使用 mini 系列
Gemini	Gemini 模型	系统默认	建议使用 Flash 系列

模型选择建议

选择测试模型时考虑：

成本：选择价格较低的模型（如 Haiku、Mini、Flash）
速度：选择响应快的模型
可用性：选择供应商支持的模型

检查参数配置

超时时间

参数	说明	默认值	范围
超时时间	单次请求超时	45 秒	10-120 秒

设置过短可能导致误判，设置过长会延迟故障检测。

重试次数

参数	说明	默认值	范围
最大重试	失败后重试次数	2 次	0-5 次

网络不稳定时建议增加重试次数。

降级阈值

参数	说明	默认值	范围
降级阈值	响应超过此时间标记为降级	6000ms	1000-30000ms

超过阈值的供应商会被标记为「降级」状态，但仍可使用。

执行模型检查

手动测试

在供应商卡片上点击「测试」按钮：

发送测试请求到配置的端点
使用配置的测试模型
等待响应或超时
显示测试结果

测试内容

测试请求会：

发送简短的 prompt（如 "Hi"）
限制最大输出 token（通常 10-50）
使用流式响应检测首字节时间

测试结果

健康状态

状态	图标	说明
健康	🟢	响应正常，延迟在阈值内
降级	🟡	响应正常，但延迟超过阈值
不可用	🔴	请求失败或超时

结果信息

测试完成后显示：

响应延迟（毫秒）
首字节时间（TTFB）
错误信息（如果失败）

与故障转移集成

模型检查与故障转移功能配合使用：

健康检查

开启代理服务后，系统会定期对故障转移队列中的供应商执行健康检查：

使用配置的测试模型发送请求
根据响应更新健康状态
不健康的供应商会被暂时跳过

熔断恢复

当供应商从熔断状态恢复时：

执行模型检查验证可用性
检查通过后恢复正常状态
检查失败则继续熔断

常见问题

测试失败但实际可用

可能原因：

测试模型与实际使用的模型不同
供应商不支持配置的测试模型

解决方法：

修改测试模型为供应商支持的模型
检查供应商的模型列表

延迟过高

可能原因：

网络延迟
供应商服务器负载高
模型响应慢

解决方法：

使用更快的测试模型
调整降级阈值
考虑使用镜像端点

频繁超时

可能原因：

超时时间设置过短
网络不稳定
供应商服务不稳定

解决方法：

增加超时时间
增加重试次数
检查网络连接

注意事项

模型检查会消耗少量 API 配额
建议使用低成本模型进行测试
测试频率不宜过高，避免浪费配额
不同供应商支持的模型可能不同

3.6 KiB Raw Blame History Unescape Escape

4.5 模型检查

功能说明

打开配置

测试模型配置

模型选择建议

检查参数配置

超时时间

重试次数

降级阈值

执行模型检查

手动测试

测试内容

测试结果

健康状态

结果信息

与故障转移集成

健康检查

熔断恢复

常见问题

测试失败但实际可用

延迟过高

频繁超时

注意事项

3.6 KiB

Raw Blame History