Wyszukiwanie po tagach gówno daje.Trzeba naprawić tę wyszukiwarkę! Za co ja tu kurwa płacę?
Wyszukiwanie po tagach gówno daje.
Może by tak dać jakieś porównywanie obrazów? Typu perceptual hash?
Tak na przykład: bierzemy mały zestaw pikseli z każdej klatki, powiedzmy 8x8 (czyli dla poziomej rozdzielczości 1920 bierzemy na przykład piksel 120, 360, 600, 840, 1080, 1320, 1660, 1800 (celowo nie biorę pikseli skrajnych tylko środek każdego pola)), każdy z nich obcinamy do jednej z 256 wartości. W ten sposób nawet jeśli filmy były kilkakrotnie kompresowane z jakością HujHD, jest bardzo duża szansa że hash będzie taki sam (możliwe że artefakt kompresji akurat przekroczy granicę jednego z 256 kolorów, no ale cóż). To zredukuje nam każdą klatkę do 64 bajtów.
Dubel będzie miał przynajmniej 10-20 sekund wspólnych: filmy są różnie pocięte/posklejane ale z dużych wspólnych fragmentów. Czyli szukamy 250-500 takich samych hashy pod rząd. Problemem jest że nie wiemy z jakim przesunięciem wspólny fragment się zaczyna, ale chyba na to jakieś algorytmy też są.
Ja się na tym nie znam: ostatni raz grafiką bawiłam się w Turbo Pascalu kiedy większość ludzi tutaj srała w pieluchy. Ale są ludzie którzy się na tym znają. Może by ruszyć ten temat?
Ale liczyć odległości można tylko 1 do 1, czyli trzeba by porównywać każdą parę. A filmów jest ponad 4TB, za dużo. Zaś hashe można szukać jako stringi.