finetuning-vision-models

Here are 13 public repositories matching this topic...

ReinFlow / ReinFlow

[NeurIPS 2025] Flow x RL. "ReinFlow: Fine-tuning Flow Policy with Online Reinforcement Learning". Support VLAs e.g., pi0, pi0.5. Fully open-sourced.

flow robotics rl manipulation locomotion vla robot-learning fine-tuning post-training actorcritic pi0 policygradient finetuning-rl visuomotor finetuning-vision-models flowmatching onlinerl

Updated Mar 21, 2026
Python

SuyogKamble / simpleVLM

Star

building a simple VLM. Implementing LlaMA-SmolLM2 from scratch + SigLip2 Vision Model. KV-Caching is supported and implemented from scratch as well

nlp computer-vision deep-learning transformers pytorch vlm multimodal huggingface llm vision-language-model finetuning-llms finetuning-vision-models

Updated Feb 19, 2026
Jupyter Notebook

shreydan / simpleVLM

Star

building a simple VLM. Implementing LlaMA-SmolLM2 from scratch + SigLip2 Vision Model. KV-Caching is supported and implemented from scratch as well

nlp computer-vision deep-learning transformers pytorch vlm multimodal huggingface llm vision-language-model finetuning-llms finetuning-vision-models

Updated May 12, 2025
Jupyter Notebook

Raxephion / loRA-Strength-Analyser

Star

A Python script to analyze images generated using a LoRA (Low-Rank Adaptation) model applied at various strength levels. This tool helps determine an optimal strength for a given LoRA by evaluating image quality and similarity to control images.

fine-tuning finetuning transformers-models safetensors low-rank-adaptation finetuning-large-language-models finetuning-vision-models

Updated May 24, 2025
Python

umair-hassan2 / paligemma-3b-finetuning

Star

Fine-tuned 3B parameters PaliGemma2 vision model on Valorant object detection improving IoU scores across all classes. Project is developed for research experimentation.

torch quantization huggingface vision-transformer vision-language-model siglip finetuning-vision-models

Updated Aug 29, 2025
Jupyter Notebook

DURGESH716 / Fine_tuned_Multimodal_AI_Retinal_Diagnostic_System

Star

Multimodal Medical AI Fine-Tuned on Qwen-2.5-VL-7B with LoRA + Medical Distillation

ai-safety distillation medical-ai finetuning-vision-models qwen2-5-vl-7b

Updated Feb 16, 2026
Python

carlos-h-Al / HouseCatVision

Star

Building models from scratch and tuning pre-trained models to recognise different house cats

python computer-vision cnn-for-visual-recognition finetuning-vision-models

Updated Nov 14, 2025
Jupyter Notebook

Absurd7550 / lfm2-vl-finetune-guide

Star

Fine-tuning LiquidAI/LFM2-VL-1.6B in Colab (LoRA/4-bit) + dataset template + probe test.

colab lora peft finetuning vision-language-model finetuning-vision-models liquidai lfm2 lfm2-vl

Updated Jan 5, 2026
Jupyter Notebook

surajrao2003 / DINO_Object_Detection

Star

Fine-tuning DINO object detection model on a COCO-annotated pedestrian dataset from IIT Delhi. Includes data prep, training, evaluation, and visualization scripts.

transformers pytorch dino pedestrian-detection finetuning-vision-models

Updated May 23, 2025
Jupyter Notebook

JackTheProgrammer / Fine-tuned-YOLO11

Star

A fine tuned YOLO11 model up to 100 epochs. This custom dataset based fine tuned yolo11s is down streamed on the task of traffic signals detection in both images, videos. Furthermore, the model has been exported to the ONNX format as well. You may export it to your desired serialization format.

Updated Nov 16, 2025
Python

MMDPROJECT / multi-tag-image-classification-with-fashion-product-images

Star

This repository includes of a Multi-Tag (acronyms are Multi-Task and Multi-Output as well) Image Classification on Fashion Products Images dataset on Kaggle using EfficientNetB0 with high accuracies

computervision imageclassification efficientnetb0 finetuning-vision-models