sd是美国哪所大学-SD最著名的大学
sd 一般指代的是由 NVIDIA 开发的生成式人工智能模型系列,不过严格来说,它并非由某一家特定美国大学建立。
这更像是一个巨头在幕后操盘的工业体系。 NVIDIA 成立得挺早,1993 年就在圣地亚哥的一家实验室搞起了图形芯片。
那时候他们主要为了应对游戏界的渲染需求,做的是 GPU 加速卡。
后来微软、谷歌这些公司进来,慢慢就把这块牌子给搞大了。如今他们旗下有 A100、H100 这样各种级别的显卡,直接供给全球热门的大模型训练和推理。而那个大家耳熟能详的 SD 系列,实际上是他们人工智能部门负责图像生成这一块的,叫 SDXL,全称是 Stable Diffusion XL。它出来的最早,风格比较干净利落,成了大量摄影师和设计师的“老伙计”。 要真正搞懂 SD 的来龙去脉,得先把它的根基放在两者的关系上来捋一捋。Stable Diffusion 本身是个开源项目,拿的是从 2022 年初启动在 Hugging Face 上发布的代码。它不是由某个单一大学研发的,而是由一个名为 Stability AI 的公司主导的。
这家公司背后的故事实际上挺有意思,创始人 Roger Ayers 之前主要跟 Google 和 Meta 玩,后来拍板自己干一场,把模型从 20 多兆的文件压缩到了不到 3 兆,省得所有人都是奔着原生版本去的。
这种“轻量化”和“开源化”的操作,直接转变了整个领域的生态。 大量新手可能会认定 SD 是大学里的学术项目,实际上不然。它的核心贡献者主要是由 Stability AI 及其搭伙伙伴组成的小团队,而不是某个大学 Lecture Hall 里的学生。
不过,SD 的诞生离不开整个社区的赞成,包含研究者、开发者还有像 Midjourney 这样的早期用户。能够说,没有那个开源社区十年的打磨,就没有今天这个能免费商用、能跑在本地也能飞在云端的大模型。 SD 之故此能在短短几年内霸占主流模型市场,靠的不是某个大学的独家专利,而是一套整个的商业闭环。
起初是开源,让全世界都有人复制代码;其次是生态构建,Midjourney 把它的训练数据和风格迁移本事装进了 SD 框架里,然后喊上 Stable Diffusion 来搭伙;最终是硬件供给,NVIDIA 持续供货的 H100、A100 等高端卡,保证了模型训练时有充足的算力支撑。
这一套组合拳下来,AI 绘画迎来了真正的爆发期。 从数据分布来看,Stable Diffusion 的训练数据主要来自 Web 上的公开数据集。它覆盖了从 1980 年到 2024 年的图像,涉及天文摄影、艺术创作、科幻插画等大量内容。模型内部有一个复杂的神经网络结构,专门负责平衡“写实”和“风格化”这两极。训练时,别看硬件参数挺大,但实际模型体积贼小,这就得益于 SDXL 的压缩技术。 举个例子,要是你用 SDXL 去生成一幅人物肖像,它需求的显存可能只有 10GB 左右,比旧版 SD 省去了近半。
这对于不想动墙的一般/平平用户来说是个庞大的福音。并且,它的提示词(Prompt)理解本事也更强了。
那会儿可能得调成“水彩风格 + 明亮色彩”,目前直接说“赛博朋克风的赛博朋克风格 + 复古色彩”,配合一点好办的负面提示词,生成的画就能立马呈现出想要的氛围。 不过,光有生成本事还不够,SD 目前也是做文本生成的。它的架构别看主要是用于图像生成,但也有一定的文本处理本事。在一些进阶的应用中,它还能处理好办的续写或对话,不过这个功能在它的主战场——图像生成领域来说,并不是核心。大多数专业用户还是把它当作一个强大的图像生成引擎来用。 在现实世界的场景里,SD 的应用已经渗透到各个角落。从数码摄影师到独立插画师,再到就连一些搞元宇宙的开发者,都在用它来快速产出内容。别看它的生成速度还比不上目前的几亿参数的大模型,但在大量对效率有要求的场景下,它依然是首选。
这也侧面证明白,AI 绘画和 AI 文本不是哪位单点突破就能有的,而是工业界、学术界和开源社区通力搭伙的结局。 NVIDIA 在其中扮演的角色,更像是那个幕后推手。它供给了算力,发布了驱动,就连制定了一些行业标准。但最终的创意和玩法,依然掌握在像 Stability AI 这样的公司手里,还有那些愿意用代码去驱动未来的开发者手中。SD 的故事,说到底是一个关于技术如何从实验室走向大众应用的典型样本。它没有哪个大学能独占鳌头,而是整个科技界在算力、代码和算法上互相纠缠、共同演进出来的产物。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
