视频生成学习笔记
-
多模态(Multimodal) 及 多模态大语言模型(MLLMs) 学习笔记
多模态(Multimodal) 及 多模态大模型(LMMs/MLLMs) 学习笔记
-
LLMs(Large Language Models) 学习笔记
LLM学习笔记
-
Image Steganography
图像隐写技术初探 (Image Steganography methods, which alter the pixel values of images to embed secret messages.) eg: HiDDeN, SteganoGAN.
-
HugginFace系列:diffusers库
🤗 diffusers 是用于生成图像、音频甚至分子 3D 结构的先进预训练扩散模型的首选库。无论您是在寻找简单的推理解决方案还是想要训练自己的扩散模型,🤗 diffusers 都是一个支持两者的模块化工具箱。我们的库在设计时注重【可用性】大于性能、【简单性】大于易用性、以及【可定制性】大于抽象性。
-
HugginFace系列:transformers库
🤗 transformers 提供 API 和工具,可轻松下载和训练最先进的预训练模型。使用预训练模型可以降低计算成本、减少碳足迹,并节省从头开始训练模型所需的时间和资源。这些模型支持不同模式下的常见任务,如Natural Language Processing (NLP), Computer Vision (CV), Audio, Multimodel等。
-
Foundation of Diffusion Models
扩散模型基础知识
-
Backdoored ESD
可恢复的概念擦除后门模型
-
[EECS498/598] lecture 15: Object Detection(目标检测)
密歇根大学EECS498-007/598-005课程笔记(十五)
-
[EECS498/598] lecture 13: Attention(注意力机制)
密歇根大学EECS498-007/598-005课程笔记(十三)