飞牛(FNOS)虚拟机开启IOMMU更新日期:2025年11月5日
简介IOMMU(Input/Output Memory Management Unit,输入输出内存管理单元)是一种硬件技术,允许虚拟机直接访问物理硬件设备,如显卡、网卡等。在飞牛(FNOS)虚拟机中开启IOMMU可以实现硬件直通功能,提升虚拟机性能,特别是对于需要GPU加速的应用场景。
本文档将详细介绍在飞牛(F...
飞牛(FNOS)安装nvidia显卡驱动默认的飞牛系统是不会安装nvidia显卡驱动的,需要手动安装。
登陆web界面,点击“应用中心”,点击“驱动”分区,找到“nvidia-driver-<版本号>”,点击“安装”。
勾选 “安装完成后立即启用”
使用ssh连接服务器,切换至root用户。
执行以下命令,检查nvidia显卡驱动是否安装成功。
1nvidia-smi...
简介本文档提供了在本地环境中编译定制OpenWrt系统固件的详细步骤,包括环境准备、依赖安装、源码下载、配置定制以及编译过程。
参考资料
OpenWrt 官方文档
OpenWrt GitHub 仓库
一、准备工具
虚拟机软件VMware
Ubuntu-22.04.2系统
SSH登录工具 finalshell
科学上网工具(自备)
二、环境搭建1. 安装虚拟机安装好虚拟机,打开软件,点击创...
什么是 TCP BBR?为什么你需要它?在如今这个对网络速度要求越来越高的时代,服务器的网络性能直接影响着用户体验和业务效率。
TCP BBR (Bottleneck Bandwidth and Round-trip propagation time) 是由 Google 开发的一种先进的 TCP 拥塞控制算法。与传统的基于丢包的拥塞控制算法(如 Cubic)不同,BBR 通过主动探测网络的...
适用环境本文档适用于以下系统和架构:
操作系统:银河麒麟 V10 / Advanced Server
CPU 架构:aarch64(ARM64)
系统基础:基于 RHEL/CentOS 或 openEuler
第一步:确认系统信息在安装之前,请先确认您的系统信息是否符合要求:
12345# 查看操作系统版本cat /etc/os-release# 查看 CPU 架构(...
引言:为什么你的 LM Studio 吞吐上不去?很多团队把 LM Studio 当成”一键部署”的 demo 来跑,却忽略了它真正的系统能力。结果就是:
❌ GPU 利用率上不去(30-50%)
❌ 首令牌延迟飘忽不定
❌ 并发一高就频繁抢占
❌ 模型频繁加载/卸载,浪费资源
根据实测经验,大部分 LLM 服务栈的瓶颈不在算力,而是 KV-bound——KV 缓存配置不当,再...
正文内容
文档来源:ModelScope 官方文档
什么是 API Inference?ModelScope(魔搭社区)通过 API Inference 将开源模型服务化,通过标准化 API 接口免费提供给广大开发者体验。
⚠️ API Inference 本身是非商业化、非盈利产品。
📋 使用限制总览
限制类型
配额
每用户每日总调用次数
2,000 次
单个模型每日...
功能说明New API 支持在单个渠道中配置多个 API 密钥,并提供密钥轮询功能。这对于以下场景非常有用:
负载均衡:将请求分散到多个密钥,避免单个密钥达到速率限制
高可用性:当某个密钥失效时自动切换到其他可用密钥
成本优化:充分利用多个账号的免费额度
前置要求
⚠️ 重要提示:密钥轮询模式必须搭配 Redis 和内存缓存功能使用,否则性能将大幅降低,并且无法实现轮询功能。
因此,我...
由于国内网络环境复杂,抗DNS污染和DNS劫持需要,因此仅列出加密协议的公共DNS
DNS_Over_TLS
DNS服务提供商
DNS查询服务地址
控制台/官方文档
Google Public DNS
dns.google.com
阿里云公共DNS(限速)
dns.alidns.com
https://alidns.com/articles/6018321800a4...
Linux中安装GitUbuntu/Debian在Ubuntu/Debian中安装Git十分简单,使用系统自带的APT包管理器即可一键安装:
12sudo apt update && apt upgrade -y ## 获取权限并更新apt索引和已安装软件apt install git -y ## 安装 git
CentOSCentOS采用YUM作为包管...