今天的主題是影像相似度的比較,影像相似度可以分為圖片層級和影片層級。圖片層級通常是對 pixel 暴力計算或萃取出圖像的特徵結構再進行比較;而影片層級就複雜多了,影片可以萃取的特徵大方向就有 image 和 audio 兩種,細分下去有更多的特徵可以比對。
今天我主要嘗試 videohash 這個套件,在影片相似度上可以達到什麼樣的效果。
環境安裝
ffmpeg
我這邊的環境是在 Windows,預設各位都是建置環境的熟手,因此接下來會速速帶過安裝 ffmpeg 的方式。
- 首先,到官網 下載 ffmpeg .7z 的壓縮檔。
- 在
C:\Program Files中建立”ffmpeg”資料夾。 - 將 .7z 的壓縮檔解壓縮並將 bin 資料夾複製到
C:\Program Files\ffmpeg。 - 開啟系統環境變數設置,將
C:\Program Files\ffmpeg\bin加入其中。 - cmd 執行
ffmpeg -version,有顯示出版本就是成功啦。
videohash
這裡直接使用原作者建議地從 PyPi 下載
1 | python3 -m pip install --upgrade pip |
Coding
大量讀取影片 path 及 threading 加速的方式相信大家都不陌生,我就不獻醜了,下面展示如何使用videohash
1 | import ffmpeg |
為了避免手殘不小心要重跑程式,我把所有的結果都存成 pkl;上方同時展示了 videohash 包含的一些資訊。
接下來則是讀取存成 .pkl 的 videohash obj,並進行兩部影片之間的比較。
1 | def read_pkl(path): |
分析
這次的嘗試發現了幾個有趣的現象
- 影片前幾秒有相似片段的(相同的開頭動畫、同一個主持人拿著字卡)會容易被視為相似的影片
- 短影音有相同顏色、樣式模板的影片也容易被視為相似
- 從原始影片剪輯出來的精華片段或是短影音並不會被視為相似的影片