Publications

Rishav Pramanik, Antoine Poupon, Juan a Rodriguez, Masih Aminbeidokhti, David Vázquez, Christopher Pal, Zhaozheng Yin, Marco Pedersoli (2025). Distilling Specialized Orders for Visual Generation. arXiv preprint arXiv:2504.17069.

PDF

Juan A. Rodriguez, Xiangru Jian, Siba Smarak Panigrahi, Tianyu Zhang, Aarash Feizi, Abhay Puri, Others, David Vázquez, Christopher Pal (2025). BigDocs: An Open Dataset for Training Multimodal Models on Document and Code Tasks. International Conference on Learning Representations (ICLR).

Video PDF

Ahmed Masry, Abhay Puri, Masoud Hashemi, Juan a Rodriguez, Megh Thakkar, Khyati Mahajan, Vikas Yadav, Sathwik Tejaswi Madhusudhan, Alexandre Piché, Dzmitry Bahdanau, Others (2025). BigCharts-R1: Enhanced Chart Reasoning with Visual Reinforcement Finetuning. Conference on Language Modeling (COLM).

Video PDF

Ahmed Masry, Juan A. Rodriguez, Tianyu Zhang, Suyuchen Wang, Chao Wang, Aarash Feizi, Others, David Vázquez, Perouz Taslakian, Spandana Gella, Sai Rajeswar (2025). AlignVLM: Bridging Vision and Language Latent Spaces for Multimodal Document Understanding. Advances in Neural Information Processing Systems (NeurIPS).

Video PDF

Ahmed Masry, Juan A. Rodriguez, Tianyu Zhang, Suyuchen Wang, Chao Wang, Aarash Feizi, Others, David Vázquez, Perouz Taslakian, Spandana Gella, Sai Rajeswar (2025). AlignVLM: Bridging Vision and Language Latent Spaces for Multimodal Document Understanding. ICLR Workshops 2025.

Video PDF

Amirhossein Abaskohi, Amrutha Varshini Ramesh, Shailesh Nanisetty, Chirag Goel, David Vázquez, Christopher Pal, Spandana Gella, Giuseppe Carenini, Issam H Laradji (2025). AgentAda: Skill-Adaptive Data Analytics for Tailored Insight Discovery. Workshop at Association for Computational Linguistics (ACL).

PDF

Issam Laradji, Nicholas Botzer, David Vázquez (2024). Improved Training Set Selection for Semi-Supervised Learning. US Patent App. 18/336,511.

João Monteiro, Étienne Marcotte, Pierre-André Noël, Valentina Zantedeschi, David Vázquez, Nicolas Chapados, Christopher Pal, Perouz Taslakian (2024). XC-Cache: Cross-Attending to Cached Context for Efficient LLM Inference. Advances in Neural Information Processing Systems (NeurIPS).

Code PDF

Alexandre Drouin, Maxime Gasse, Massimo Caccia, Issam H. Laradji, Manuel Del Verme, Tom Marty, Léo Boisvert, Megh Thakkar, Quentin Cappart, David Vázquez, Nicolas Chapados, Alexandre Lacoste (2024). WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks?. International Conference on Machine Learning (ICML).

Code Video PDF

Christopher Beckham, Alexandre Piche, David Vázquez, Christopher Pal (2024). Towards Good Validation Metrics for Generative Models in Offline Model-Based Optimisation. Transactions on Machine Learning Research (TMLR).

PDF

No results found