Ecosystem

Products

AkademIndexScholarly search & discovery
AkademScholarMetrics & scholarly analytics
AkademIDsoonAuthor identifier & profiles

For developers

AkademBaseOpen API for the ecosystem

About Coverage Help

← Back to work

Works citing this work

3 works

Work: Vid2Seq: Large-Scale Pretraining of a Visual Language Model for Dense Video Captioning

Cross-Modal Transformer-Based Streaming Dense Video Captioning with Neural ODE Temporal Localization
Shakhnoza Muksimova, Sabina Umirzakova, Murodjon Sultanov +1
ArticleMultimodal Machine Learning ApplicationsSensors20254 citations
ABI
MIRA-CAP: Memory-Integrated Retrieval-Augmented Captioning for State-of-the-Art Image and Video Captioning
Sabina Umirzakova, Shakhnoza Muksimova, Sevara Mardieva +2
ArticleMultimodal Machine Learning ApplicationsSensors20243 citations
ABI
Video Captioning with Spatio-Temporal Graph Transformers
Shakhnoza Muksimova, Sabina Umirzakova, Sevara Mardieva +2
ChapterMultimodal Machine Learning ApplicationsLecture notes in computer science20250 citations
ABI