А мне объяснение видится в другом. Фотограф фиксирует статичную двухмерную картинку т.е. проще говоря, гораздо меньше компонентов надо свести в единый гармоничный продукт.
Видеоператор помимо того же баланса белого, экспозиции , композиции , еще имеет дело со звуком и фиксирует все это в движении. Т.е. добавляется большое кол-во факторов участвующих в создании конечного результата.
Сфоткать птичку может почти любой имеющий длиннофокусный объектив . Попробуйте снять 2-х минутны ролик о птичке

Два зонтика с вспышками, пара прочитанных книг, чуточка вкуса и человек может снимать портреты , и даже за деньги.
Попробуте снять простой 5-ти минутный игровой ролик.
Примеры могу проводить до бесконечности.
Видео- это фотография в кубе.