Junjie Wang

xiaomoguhzz

·

xiaomoguhz

AI & ML interests

computer vision, Vision-Language Models, Multimodal Large Language Models

Recent Activity

updated a dataset about 5 hours ago

xiaomoguhzz/codex-ppt-temp-visual-encoder-assets

published a dataset about 5 hours ago

xiaomoguhzz/codex-ppt-temp-visual-encoder-assets

upvoted a paper 4 days ago

UnityShots: Memory-Driven Multi-Shot Audio-Video Generation with Boundary-Aware Gating

View all activity

Organizations

Papers 1

arxiv:2505.04410

models 8

xiaomoguhzz/VisionEncoder

Updated 7 days ago

xiaomoguhzz/bagelthink

xiaomoguhzz/DeCLIP2_EVA-B_DINOv2-B_csa_560_plus_sd0.3_0.1_2.0_0.3

Updated Jul 1, 2025

xiaomoguhzz/DeCLIP_EVA-L_DINOv2-L_csa_0.05_2.0

Updated Jun 10, 2025

xiaomoguhzz/CATSeg_DeCLIP_EVA-L_DINOv2-L_csa_0.05_2.0

Updated Jun 10, 2025

xiaomoguhzz/DeCLIP_EVA-B_DINOv2-B_csa_0.05_2.0

Updated May 20, 2025

xiaomoguhzz/CATSeg_DeCLIP_EVA-B_DINOv2-B_csa_0.05_2.0

Updated May 20, 2025

xiaomoguhzz/DeCLIP_evab_dinov2B_csa_560_0.25_seg

Updated May 11, 2025

datasets 5

xiaomoguhzz/codex-ppt-temp-visual-encoder-assets

Viewer • Updated about 4 hours ago • 18

xiaomoguhzz/catseg_detectron2_data

Updated 6 days ago • 51

xiaomoguhzz/general_backup

Updated 8 days ago • 48

xiaomoguhzz/zijie_backup

Updated 20 days ago • 870

xiaomoguhzz/journal_backup_ckpt

Updated 22 days ago • 1.41k