Классный скрипт для конвертации в utf8

Запарило пересохранять субтитры, которые часто выкладывают в вин-кодировке. Нашел клевый скрипт на питоне (а значит и под виндой можно юзать) для конвертации из любой кодировки (исходная автоопределяется) в UTF8. Навесил его как кастомную команду для *.srt в Double Commander, который также юзаю в обеих системах — стало совсем хорошо =)

 
 
  1. #!/usr/bin/env python3
  2. import os
  3. import sys
  4. from chardet import detect
  5. srcfile = sys.argv[1]
  6. tmpfile = sys.argv[1] + '.tmp'
  7. bakfile = sys.argv[1] + '.bak'
  8. # get file encoding type
  9. def get_encoding_type(file):
  10.     with open(file, 'rb') as f:
  11.         rawdata = f.read()
  12.     return detect(rawdata)['encoding']
  13. from_codec = get_encoding_type(srcfile)
  14. # add try: except block for reliability
  15. try:
  16.     with open(srcfile, 'r', encoding=from_codec) as f, open(tmpfile, 'w', encoding='utf-8') as e:
  17.         text = f.read() # for small files, for big use chunks
  18.         e.write(text)
  19.     os.rename(srcfile, bakfile) # backup old encoding file
  20.     os.rename(tmpfile, srcfile) # rename new encoding
  21.    
  22. except UnicodeDecodeError:
  23.     print('Decode Error')
  24. except UnicodeEncodeError:
  25.     print('Encode Error')

Заполнение mp3-тегов скриптом

Довелось скачать саундтрек к игре в виде кучи файлов без тегов вообще.

Захотелось на скорую руку заполнить хотя бы названия и номера треков (альбом/год/жанр — одинаковые для всех, с этим все сильно проще).

Для начала из имени каждого файла нужно вычленить название трека. Используем sed в однострочном цикле для разделения имени файла на три блока. Блоки в sed выделяются экранированными скобками: начало — \(, конец — \)

 
 
  1.                                                        вычленяем блок №2
  2.                                                         |             |
 
 
  1. for file in *.mp3; do name=$(sed "s/\(^.*_.\{1,3\}_\)\(.*\)\(\.mp3\)/\2/" <<< $file); echo $name ; done;
 
 
  1.                                           |                     |    
  2.            блок №1: начало строки, любые символы,          блок №3: .mp3
  3.                     подчеркивание, 1-3 любых символа,
  4.                     подчеркивание

Вывод:

 
 
  1. chat_thiscouldbeAWESOME
  2. lab sewers
  3. chat_downthe
  4. ...

(да, если вы решаете проблему с помощью регулярных выражений — у вас уже 2 проблемы, но в данном случае это отличное решение).

Убедившись что имена получаются корректные, меняем echo $name на редактор тегов mid3v2

 
 
  1. for file in *.mp3; do name=$(sed "s/\(^.*_.\{1,3\}_\)\(.*\)\(\.mp3\)/\2/" <<< $file); mid3v2 -t "$name" "$file" ; done;

Самое сложное сделано. Теперь номера треков (всего их 46, так что это число я подставляю вручную):

 
 
  1. i=1; for file in *.mp3; do mid3v2 -T  "${i}/46" "$file" ; ((i+=1)); done;

Все одинаковые для треков теги заполняются совсем просто, например год:

 
 
  1. for file in *.mp3; do mid3v2 -y 2010  "$file" ; done;

PS: утилита mid3v2 (рекомендуется как полностью поддерживающая v2/utf8-теги) входит в питоновский пакет mutagen и ставится примерно так (для debian/ubuntu)

 
 
  1. apt install python3-mutagen

или так (установка в пользовательский профиль из репозитория pypi)

 
 
  1. pip3 install --user mutagen

RussianFIO2AD — генератор учеток для Active Directory

По работе регулярно сталкиваюсь с присланными списками ФИО, которые нужно сконвертировать в учетки AD с шаблонными логинами и паролями. Для этих целей еще с год назад написал небольшую прожку, которую все это время тестировал, а сейчас немного допилил и могу поделиться.

Выглядит незамысловато

Вставляем из буфера список ФИО — поддерживается вставка из текстового файла или таблицы (с некоторыми оговорками, но как правило работает) — потом генерируем логины и пароли, проверяем чтобы в AD не было дублей и создаем учетки. Процесс коротенько можно увидеть на ютубе.

Скачать прожку можно на гитхабе: https://github.com/qiwichupa/RussianFIO2AD

Как всегда в таких случаях: нормальная работа не гарантируется, используйте на свой страх и риск, то, что у меня AD не сломалось — ничего не значит, может быть мне повезло)

py-subsrenamer: массовое переименование субтитров

Решил переписать на питоне башевый скрипт для переименования субтитров (согласно именам видеофайлов), чтобы можно было его использовать под виндой. Заодно оформил вариант с простеньким графическим интерфейсом (и немножко ознакомился с wxPython)

Скачать можно тут: https://github.com/qiwichupa/py-subsrenamer (экзешники смотреть тут)

Пример использования

Что нужно для просмотра сериала?

Горячий кофе, мягкий плед, гроза за окном — многое может пригодиться. Но совершенно точно под рукой должны быть: добротный файлменеджер с функцией массового переименования, и скрипт для столь же массового переименования субтитров по имени серий.

Как автоматически скачивать сериалы и субтитры к ним

Довольно долгое время искал какие-то решения, позволяющие «подписаться» на торренты с интересными сериалами, но так как для меня важно наличие русский сабов (а их буржуи не раздают, как это ни странно), то часто реально оказывалось проще дождаться раздачи на наших сайтах, где все уже подбито. Но наконец, закинув в очередной раз невод в море, я выудил нечто похожее на золотую рыбку. Состоит рыбка из трех компонентов…

Торрент-клиент

В основе сервера будет transmission-daemon — идеальный для этого случая клиент. Примерный конфиг для него будет такой:

settings.json
 
  1. {
  2. "alt-speed-down": 50,
  3. "alt-speed-enabled": false,
  4. "alt-speed-time-begin": 540,
  5. "alt-speed-time-day": 127,
  6. "alt-speed-time-enabled": false,
  7. "alt-speed-time-end": 1020,
  8. "alt-speed-up": 50,
  9. "bind-address-ipv4": "0.0.0.0",
  10. "bind-address-ipv6": "::",
  11. "blocklist-enabled": true,
  12. "blocklist-url": "http://list.iblocklist.com/?list=bt_level1&fileformat=p2p&archiveformat=gz",
  13. "cache-size-mb": 4,
  14. "dht-enabled": true,
  15. "download-dir": "/share/torrents",
  16. "download-queue-enabled": true,
  17. "download-queue-size": 5,
  18. "encryption": 2,
  19. "idle-seeding-limit": 30,
  20. "idle-seeding-limit-enabled": false,
  21. "incomplete-dir": "/share/torrents/inc",
  22. "incomplete-dir-enabled": true,
  23. "lpd-enabled": true,
  24. "message-level": 1,
  25. "peer-congestion-algorithm": "",
  26. "peer-id-ttl-hours": 6,
  27. "peer-limit-global": 500,
  28. "peer-limit-per-torrent": 20,
  29. "peer-port": 59648,
  30. "peer-port-random-high": 65535,
  31. "peer-port-random-low": 49152,
  32. "peer-port-random-on-start": false,
  33. "peer-socket-tos": "default",
  34. "pex-enabled": true,
  35. "port-forwarding-enabled": true,
  36. "preallocation": 0,
  37. "prefetch-enabled": true,
  38. "queue-stalled-enabled": true,
  39. "queue-stalled-minutes": 30,
  40. "ratio-limit": 2,
  41. "ratio-limit-enabled": false,
  42. "rename-partial-files": true,
  43. "rpc-authentication-required": false,
  44. "rpc-bind-address": "0.0.0.0",
  45. "rpc-enabled": true,
  46. "rpc-host-whitelist": "",
  47. "rpc-host-whitelist-enabled": false,
  48. "rpc-password": "",
  49. "rpc-port": 9091,
  50. "rpc-url": "/transmission/",
  51. "rpc-username": "admin",
  52. "rpc-whitelist": "127.0.0.1",
  53. "rpc-whitelist-enabled": false,
  54. "scrape-paused-torrents-enabled": true,
  55. "script-torrent-done-enabled": false,
  56. "script-torrent-done-filename": "",
  57. "seed-queue-enabled": false,
  58. "seed-queue-size": 10,
  59. "speed-limit-down": 100,
  60. "speed-limit-down-enabled": false,
  61. "speed-limit-up": 100,
  62. "speed-limit-up-enabled": false,
  63. "start-added-torrents": true,
  64. "trash-original-torrent-files": false,
  65. "umask": 0,
  66. "upload-slots-per-torrent": 14,
  67. "utp-enabled": true,
  68. "watch-dir": "/share/torrents/watch",
  69. "watch-dir-enabled": true
  70. }

Этот конфиг подразумевает что у нас есть каталог ​/share/torrents, в который будут падать торренты, а также два подкаталога — inc и watch. Первый  для размещения файлов в процессе скачивания, второй для скачивания торрентов, вручную кинутых в этот каталог.

Вебморда: http://IP:9091/transmission/web/, логин admin без пароля

Граббилка торрентов

Шикарный проект torrentwatch-xa,  который мониторит RSS-фиды различных трекеров (есть набор дефолтных и возможность добавить свои), выцепляет названия, интересующие нас. и добавляет их на скачивание. Как правило сериалы выкладываются по сериям, так что свежие всегда будут появляться у нас как только так сразу.

Установка описана на гитхабе, так что сразу к настройкам. Прописываем настройки подключения к торрент-клиенту — он может быть как локальным, так и удаленным. Указываем корневую папку в которую будут скачиваться сериалы.

Указываем чтобы сериалы качались каждый в свою папку по названию сериала, и выставляем лимит раздачи (в данном случае 20 к 1, то есть гиг скачали — 20 раздали и остановились)

Вкладка Favorites отвечает за настройки мониторинга тех сериалов, которые мы захотим скачать. Использовать регулярные выражения для вычленения имени сериала, искать во всех фидах, качать только торренты с номерами сезона и эпизода в названии, скачивать только новые эпизоды (об этом ниже)

Теперь о том как выглядит наше избранное и как добавить сериал. Ну, примерно так

Разберем на примере доктора кто, имя торрента с его серией будет примерно таким: doctor.who.2005.s12e07.720p.hdtv.x264-mtb[eztv]

Имя — это просто имя, может быть произвольным; фильтр — как правило совпадает с именем указанным в имени торрента, но игнорирует точки; quality — качество, которое кодируется или как разрешение (720p), или как тип рипа (webrip/hdtv и т.д.), можно указывать или так или эдак; Last Downloaded — последний добавленный в скачивание эпизод (это поле обновляется автоматически, но его можно поменять и вручную, если часть эпизодов у нас уже есть и мы хотим качать только новое), при добавлении нового сериала это поле заполняется в формате SSxEE (SS — номер сезона, EE — номер эпизода, напр. 02×08)

Скачиватель субтитров

Как правило, для большинства сериалов субтитры рано или поздно находятся на opensubtitles.org, и было бы логично искать их там. Но хотелось бы делать это автоматически. И есть такой скрипт: https://github.com/emericg/OpenSubtitlesDownload

/opt/OpenSubtitlesDownload.py
 
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. # OpenSubtitlesDownload.py / Version 4.1
  4. # This software is designed to help you find and download subtitles for your favorite videos!
  5. # You can browse the project's GitHub page:
  6. # https://github.com/emericg/OpenSubtitlesDownload
  7. # Learn much more about OpenSubtitlesDownload.py on its wiki:
  8. # https://github.com/emericg/OpenSubtitlesDownload/wiki
  9. # You can also browse the official website:
  10. # https://emeric.io/OpenSubtitlesDownload
  11. # Copyright (c) 2020 by Emeric GRANGE <emeric.grange@gmail.com>
  12. #
  13. # This program is free software: you can redistribute it and/or modify
  14. # it under the terms of the GNU General Public License as published by
  15. # the Free Software Foundation, either version 3 of the License, or
  16. # (at your option) any later version.
  17. #
  18. # This program is distributed in the hope that it will be useful,
  19. # but WITHOUT ANY WARRANTY; without even the implied warranty of
  20. # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  21. # GNU General Public License for more details.
  22. #
  23. # You should have received a copy of the GNU General Public License
  24. # along with this program.  If not, see <https://www.gnu.org/licenses/>.
  25. # Contributors / special thanks:
  26. # Thiago Alvarenga Lechuga <thiagoalz@gmail.com> for his work on the 'Windows CLI' and the 'folder search'
  27. # jeroenvdw for his work on the 'subtitles automatic selection' and the 'search by filename'
  28. # Gui13 for his work on the arguments parsing
  29. # Tomáš Hnyk <tomashnyk@gmail.com> for his work on the 'multiple language' feature
  30. # Carlos Acedo <carlos@linux-labs.net> for his work on the original script
  31. import os
  32. import re
  33. import sys
  34. import time
  35. import gzip
  36. import struct
  37. import argparse
  38. import mimetypes
  39. import subprocess
  40. if sys.version_info >= (3, 0):
  41.     import shutil
  42.     import urllib.request
  43.     from xmlrpc.client import ServerProxy, Error
  44. else: # python2
  45.     import urllib
  46.     from xmlrpclib import ServerProxy, Error
  47. # ==== Opensubtitles.org server settings =======================================
  48. # XML-RPC server domain for opensubtitles.org:
  49. osd_server = ServerProxy('https://api.opensubtitles.org/xml-rpc')
  50. # You can use your opensubtitles.org account to avoid "in-subtitles" advertisment
  51. # and bypass download limits. Be careful about your password security, it will be
  52. # stored right here in plain text... You can also change opensubtitles.org language,
  53. # it will be used for error codes and stuff.
  54. osd_username = ''
  55. osd_password = ''
  56. osd_language = 'en'
  57. # ==== Language settings =======================================================
  58. # 1/ Change the search language by using any supported 3-letter (ISO 639-2) language codes:
  59. #    > Supported ISO codes: https://www.opensubtitles.org/addons/export_languages.php
  60. # 2/ Search for subtitles in several languages at once by using multiple codes separated by a comma:
  61. #    > Exemple: opt_languages = ['eng,fre']
  62. opt_languages = ['eng']
  63. # Write 2-letter language code (ex: _en) at the end of the subtitles file. 'on', 'off' or 'auto'.
  64. # If you are regularly searching for several language at once, you sould use 'on'.
  65. opt_language_suffix = 'auto'
  66. opt_language_separator = '_'
  67. # ==== Search settings =========================================================
  68. # Subtitles search mode. Can be overridden at run time with '-s' argument.
  69. # - hash (search by hash)
  70. # - filename (search by filename)
  71. # - hash_then_filename (search by hash, then filename if no results)
  72. # - hash_and_filename (search using both methods)
  73. opt_search_mode = 'hash_then_filename'
  74. # Search and download a subtitles even if a subtitles file already exists.
  75. opt_search_overwrite = 'on'
  76. # Subtitles selection mode. Can be overridden at run time with '-t' argument.
  77. # - manual (always let you choose the subtitles you want)
  78. # - default (in case of multiple results, let you choose the subtitles you want)
  79. # - auto (automatically select the best subtitles found)
  80. opt_selection_mode = 'default'
  81. # Customize subtitles download path. Can be overridden at run time with '-o' argument.
  82. # By default, subtitles are downloaded next to their video file.
  83. opt_output_path = ''
  84. # ==== GUI settings ============================================================
  85. # Select your GUI. Can be overridden at run time with '--gui=xxx' argument.
  86. # - auto (autodetection, fallback on CLI)
  87. # - gnome (GNOME/GTK based environments, using 'zenity' backend)
  88. # - kde (KDE/Qt based environments, using 'kdialog' backend)
  89. # - cli (Command Line Interface)
  90. opt_gui = 'auto'
  91. # Change the subtitles selection GUI size:
  92. opt_gui_width  = 720
  93. opt_gui_height = 320
  94. # Various GUI options. You can set them to 'on', 'off' or 'auto'.
  95. opt_selection_hi       = 'auto'
  96. opt_selection_language = 'auto'
  97. opt_selection_match    = 'auto'
  98. opt_selection_rating   = 'off'
  99. opt_selection_count    = 'off'
  100. # ==== Exit codes ==============================================================
  101. # Exit code returned by the software. You can use them to improve scripting behaviours.
  102. # 0: Success, and subtitles downloaded
  103. # 1: Success, but no subtitles found
  104. # 2: Failure
  105. # ==== Super Print =============================================================
  106. # priority: info, warning, error
  107. # title: only for zenity and kdialog messages
  108. # message: full text, with tags and breaks (tags will be cleaned up for CLI)
  109. def superPrint(priority, title, message):
  110.     """Print messages through terminal, zenity or kdialog"""
  111.     if opt_gui == 'gnome':
  112.         subprocess.call(['zenity', '--width=' + str(opt_gui_width), '--' + priority, '--title=' + title, '--text=' + message])
  113.     elif opt_gui == 'kde':
  114.         # Adapt to kdialog
  115.         message = message.replace("\n", "<br>")
  116.         message = message.replace('\\"', '"')
  117.         if priority == 'warning':
  118.             priority = 'sorry'
  119.         elif priority == 'info':
  120.             priority = 'msgbox'
  121.         subprocess.call(['kdialog', '--geometry=' + str(opt_gui_width) + 'x' + str(opt_gui_height), '--title=' + title, '--' + priority + '=' + message])
  122.     else:
  123.         # Clean up formating tags from the zenity messages
  124.         message = message.replace("\n\n", "\n")
  125.         message = message.replace("<i>", "")
  126.         message = message.replace("</i>", "")
  127.         message = message.replace("<b>", "")
  128.         message = message.replace("</b>", "")
  129.         message = message.replace('\\"', '"')
  130.         print(">> " + message)
  131. # ==== Check file path & type ==================================================
  132. def checkFileValidity(path):
  133.     """Check mimetype and/or file extension to detect valid video file"""
  134.     if os.path.isfile(path) is False:
  135.         return False
  136.     fileMimeType, encoding = mimetypes.guess_type(path)
  137.     if fileMimeType is None:
  138.         fileExtension = path.rsplit('.', 1)
  139.         if fileExtension[1] not in ['avi', 'mp4', 'mov', 'mkv', 'mk3d', 'webm', \
  140.                                     'ts', 'mts', 'm2ts', 'ps', 'vob', 'evo', 'mpeg', 'mpg', \
  141.                                     'm1v', 'm2p', 'm2v', 'm4v', 'movhd', 'movx', 'qt', \
  142.                                     'mxf', 'ogg', 'ogm', 'ogv', 'rm', 'rmvb', 'flv', 'swf', \
  143.                                     'asf', 'wm', 'wmv', 'wmx', 'divx', 'x264', 'xvid']:
  144.             #superPrint("error", "File type error!", "This file is not a video (unknown mimetype AND invalid file extension):\n<i>" + path + "</i>")
  145.             return False
  146.     else:
  147.         fileMimeType = fileMimeType.split('/', 1)
  148.         if fileMimeType[0] != 'video':
  149.             #superPrint("error", "File type error!", "This file is not a video (unknown mimetype):\n<i>" + path + "</i>")
  150.             return False
  151.     return True
  152. # ==== Check for existing subtitles file =======================================
  153. def checkSubtitlesExists(path):
  154.     """Check if a subtitles already exists for the current file"""
  155.     for ext in ['srt', 'sub', 'sbv', 'smi', 'ssa', 'ass', 'usf']:
  156.         subPath = path.rsplit('.', 1)[0] + '.' + ext
  157.         if os.path.isfile(subPath) is True:
  158.             superPrint("info", "Subtitles already downloaded!", "A subtitles file already exists for this file:\n<i>" + subPath + "</i>")
  159.             return True
  160.         # With language code? Only check the first language (and probably using the wrong language suffix format)
  161.         if opt_language_suffix in ('on', 'auto'):
  162.             if len(opt_languages) == 1:
  163.                 splitted_languages_list = opt_languages[0].split(',')
  164.             else:
  165.                 splitted_languages_list = opt_languages
  166.             subPath = path.rsplit('.', 1)[0] + opt_language_separator + splitted_languages_list[0] + '.' + ext
  167.             if os.path.isfile(subPath) is True:
  168.                 superPrint("info", "Subtitles already downloaded!", "A subtitles file already exists for this file:\n<i>" + subPath + "</i>")
  169.                 return True
  170.     return False
  171. # ==== Hashing algorithm =======================================================
  172. # Info: https://trac.opensubtitles.org/projects/opensubtitles/wiki/HashSourceCodes
  173. # This particular implementation is coming from SubDownloader: https://subdownloader.net
  174. def hashFile(path):
  175.     """Produce a hash for a video file: size + 64bit chksum of the first and
  176.     last 64k (even if they overlap because the file is smaller than 128k)"""
  177.     try:
  178.         longlongformat = 'Q' # unsigned long long little endian
  179.         bytesize = struct.calcsize(longlongformat)
  180.         fmt = "<%d%s" % (65536//bytesize, longlongformat)
  181.         f = open(path, "rb")
  182.         filesize = os.fstat(f.fileno()).st_size
  183.         filehash = filesize
  184.         if filesize < 65536 * 2:
  185.             superPrint("error", "File size error!", "File size error while generating hash for this file:\n<i>" + path + "</i>")
  186.             return "SizeError"
  187.         buf = f.read(65536)
  188.         longlongs = struct.unpack(fmt, buf)
  189.         filehash += sum(longlongs)
  190.         f.seek(-65536, os.SEEK_END) # size is always > 131072
  191.         buf = f.read(65536)
  192.         longlongs = struct.unpack(fmt, buf)
  193.         filehash += sum(longlongs)
  194.         filehash &= 0xFFFFFFFFFFFFFFFF
  195.         f.close()
  196.         returnedhash = "%016x" % filehash
  197.         return returnedhash
  198.     except IOError:
  199.         superPrint("error", "I/O error!", "Input/Output error while generating hash for this file:\n<i>" + path + "</i>")
  200.         return "IOError"
  201. # ==== GNOME selection window ==================================================
  202. def selectionGnome(subtitlesList):
  203.     """GNOME subtitles selection window using zenity"""
  204.     subtitlesSelected = ''
  205.     subtitlesItems = ''
  206.     subtitlesMatchedByHash = 0
  207.     subtitlesMatchedByName = 0
  208.     columnHi = ''
  209.     columnLn = ''
  210.     columnMatch = ''
  211.     columnRate = ''
  212.     columnCount = ''
  213.     # Generate selection window content
  214.     for item in subtitlesList['data']:
  215.         if item['MatchedBy'] == 'moviehash':
  216.             subtitlesMatchedByHash += 1
  217.         else:
  218.             subtitlesMatchedByName += 1
  219.         subtitlesItems += '"' + item['SubFileName'] + '" '
  220.         if opt_selection_hi == 'on':
  221.             columnHi = '--column="HI" '
  222.             if item['SubHearingImpaired'] == '1':
  223.                 subtitlesItems += '"✔" '
  224.             else:
  225.                 subtitlesItems += '"" '
  226.         if opt_selection_language == 'on':
  227.             columnLn = '--column="Language" '
  228.             subtitlesItems += '"' + item['LanguageName'] + '" '
  229.         if opt_selection_match == 'on':
  230.             columnMatch = '--column="MatchedBy" '
  231.             if item['MatchedBy'] == 'moviehash':
  232.                 subtitlesItems += '"HASH" '
  233.             else:
  234.                 subtitlesItems += '"" '
  235.         if opt_selection_rating == 'on':
  236.             columnRate = '--column="Rating" '
  237.             subtitlesItems += '"' + item['SubRating'] + '" '
  238.         if opt_selection_count == 'on':
  239.             columnCount = '--column="Downloads" '
  240.             subtitlesItems += '"' + item['SubDownloadsCnt'] + '" '
  241.     if subtitlesMatchedByName == 0:
  242.         tilestr = ' --title="Subtitles for: ' + videoTitle + '"'
  243.         textstr = ' --text="<b>Video title:</b> ' + videoTitle + '\n<b>File name:</b> ' + videoFileName + '"'
  244.     elif subtitlesMatchedByHash == 0:
  245.         tilestr = ' --title="Subtitles for: ' + videoFileName + '"'
  246.         textstr = ' --text="Search results using file name, NOT video detection. <b>May be unreliable...</b>\n<b>File name:</b> ' + videoFileName + '" '
  247.     else: # a mix of the two
  248.         tilestr = ' --title="Subtitles for: ' + videoTitle + '"'
  249.         textstr = ' --text="Search results using file name AND video detection.\n<b>Video title:</b> ' + videoTitle + '\n<b>File name:</b> ' + videoFileName + '"'
  250.     # Spawn zenity "list" dialog
  251.     process_subtitlesSelection = subprocess.Popen('zenity --width=' + str(opt_gui_width) + ' --height=' + str(opt_gui_height) + ' --list' + tilestr + textstr \
  252.         + ' --column="Available subtitles" ' + columnHi + columnLn + columnMatch + columnRate + columnCount + subtitlesItems, shell=True, stdout=subprocess.PIPE)
  253.     # Get back the result
  254.     result_subtitlesSelection = process_subtitlesSelection.communicate()
  255.     # The results contain a subtitles?
  256.     if result_subtitlesSelection[0]:
  257.         if sys.version_info >= (3, 0):
  258.             subtitlesSelected = str(result_subtitlesSelection[0], 'utf-8').strip("\n")
  259.         else: # python2
  260.             subtitlesSelected = str(result_subtitlesSelection[0]).strip("\n")
  261.         # Hack against recent zenity version?
  262.         if len(subtitlesSelected.split("|")) > 1:
  263.             if subtitlesSelected.split("|")[0] == subtitlesSelected.split("|")[1]:
  264.                 subtitlesSelected = subtitlesSelected.split("|")[0]
  265.     else:
  266.         if process_subtitlesSelection.returncode == 0:
  267.             subtitlesSelected = subtitlesList['data'][0]['SubFileName']
  268.     # Return the result
  269.     return subtitlesSelected
  270. # ==== KDE selection window ====================================================
  271. def selectionKde(subtitlesList):
  272.     """KDE subtitles selection window using kdialog"""
  273.     subtitlesSelected = ''
  274.     subtitlesItems = ''
  275.     subtitlesMatchedByHash = 0
  276.     subtitlesMatchedByName = 0
  277.     # Generate selection window content
  278.     # TODO doesn't support additional columns
  279.     index = 0
  280.     for item in subtitlesList['data']:
  281.         if item['MatchedBy'] == 'moviehash':
  282.             subtitlesMatchedByHash += 1
  283.         else:
  284.             subtitlesMatchedByName += 1
  285.         # key + subtitles name
  286.         subtitlesItems += str(index) + ' "' + item['SubFileName'] + '" '
  287.         index += 1
  288.     if subtitlesMatchedByName == 0:
  289.         tilestr = ' --title="Subtitles for ' + videoTitle + '"'
  290.         menustr = ' --menu="<b>Video title:</b> ' + videoTitle + '<br><b>File name:</b> ' + videoFileName + '" '
  291.     elif subtitlesMatchedByHash == 0:
  292.         tilestr = ' --title="Subtitles for ' + videoFileName + '"'
  293.         menustr = ' --menu="Search results using file name, NOT video detection. <b>May be unreliable...</b><br><b>File name:</b> ' + videoFileName + '" '
  294.     else: # a mix of the two
  295.         tilestr = ' --title="Subtitles for ' + videoTitle + '" '
  296.         menustr = ' --menu="Search results using file name AND video detection.<br><b>Video title:</b> ' + videoTitle + '<br><b>File name:</b> ' + videoFileName + '" '
  297.     # Spawn kdialog "radiolist"
  298.     process_subtitlesSelection = subprocess.Popen('kdialog --geometry=' + str(opt_gui_width) + 'x' + str(opt_gui_height) + tilestr + menustr + subtitlesItems, shell=True, stdout=subprocess.PIPE)
  299.     # Get back the result
  300.     result_subtitlesSelection = process_subtitlesSelection.communicate()
  301.     # The results contain the key matching a subtitles?
  302.     if result_subtitlesSelection[0]:
  303.         if sys.version_info >= (3, 0):
  304.             keySelected = int(str(result_subtitlesSelection[0], 'utf-8').strip("\n"))
  305.         else: # python2
  306.             keySelected = int(str(result_subtitlesSelection[0]).strip("\n"))
  307.         subtitlesSelected = subtitlesList['data'][keySelected]['SubFileName']
  308.     # Return the result
  309.     return subtitlesSelected
  310. # ==== CLI selection mode ======================================================
  311. def selectionCLI(subtitlesList):
  312.     """Command Line Interface, subtitles selection inside your current terminal"""
  313.     subtitlesIndex = 0
  314.     subtitlesItem = ''
  315.     # Print video infos
  316.     print("\n>> Title: " + videoTitle)
  317.     print(">> Filename: " + videoFileName)
  318.     # Print subtitles list on the terminal
  319.     print(">> Available subtitles:")
  320.     for item in subtitlesList['data']:
  321.         subtitlesIndex += 1
  322.         subtitlesItem = '"' + item['SubFileName'] + '" '
  323.         if opt_selection_hi == 'on' and item['SubHearingImpaired'] == '1':
  324.             subtitlesItem += '> "HI" '
  325.         if opt_selection_language == 'on':
  326.             subtitlesItem += '> "Language: ' + item['LanguageName'] + '" '
  327.         if opt_selection_match == 'on':
  328.             subtitlesItem += '> "MatchedBy: ' + item['MatchedBy'] + '" '
  329.         if opt_selection_rating == 'on':
  330.             subtitlesItem += '> "SubRating: ' + item['SubRating'] + '" '
  331.         if opt_selection_count == 'on':
  332.             subtitlesItem += '> "SubDownloadsCnt: ' + item['SubDownloadsCnt'] + '" '
  333.         if item['MatchedBy'] == 'moviehash':
  334.             print("\033[92m[" + str(subtitlesIndex) + "]\033[0m " + subtitlesItem)
  335.         else:
  336.             print("\033[93m[" + str(subtitlesIndex) + "]\033[0m " + subtitlesItem)
  337.     # Ask user selection
  338.     print("\033[91m[0]\033[0m Cancel search")
  339.     sub_selection = -1
  340.     while(sub_selection < 0 or sub_selection > subtitlesIndex):
  341.         try:
  342.             if sys.version_info >= (3, 0):
  343.                 sub_selection = int(input(">> Enter your choice (0-" + str(subtitlesIndex) + "): "))
  344.             else: # python 2
  345.                 sub_selection = int(raw_input(">> Enter your choice (0-" + str(subtitlesIndex) + "): "))
  346.         except:
  347.             sub_selection = -1
  348.     # Return the result
  349.     if sub_selection == 0:
  350.         print("Cancelling search...")
  351.         return ""
  352.     return subtitlesList['data'][sub_selection-1]['SubFileName']
  353. # ==== Automatic selection mode ================================================
  354. def selectionAuto(subtitlesList):
  355.     """Automatic subtitles selection using filename match"""
  356.     if len(opt_languages) == 1:
  357.         splitted_languages_list = list(reversed(opt_languages[0].split(',')))
  358.     else:
  359.         splitted_languages_list = opt_languages
  360.     videoFileParts = videoFileName.replace('-', '.').replace(' ', '.').replace('_', '.').lower().split('.')
  361.     maxScore = -1
  362.     for subtitle in subtitlesList['data']:
  363.         score = 0
  364.         # points to respect languages priority
  365.         score += splitted_languages_list.index(subtitle['SubLanguageID']) * 100
  366.         # extra point if the sub is found by hash
  367.         if subtitle['MatchedBy'] == 'moviehash':
  368.             score += 1
  369.         # points for filename mach
  370.         subFileParts = subtitle['SubFileName'].replace('-', '.').replace(' ', '.').replace('_', '.').lower().split('.')
  371.         for subPart in subFileParts:
  372.             for filePart in videoFileParts:
  373.                 if subPart == filePart:
  374.                     score += 1
  375.         if score > maxScore:
  376.             maxScore = score
  377.             subtitlesSelected = subtitle['SubFileName']
  378.     return subtitlesSelected
  379. # ==== Check dependencies ======================================================
  380. def dependencyChecker():
  381.     """Check the availability of tools used as dependencies"""
  382.     if opt_gui != 'cli':
  383.         if sys.version_info >= (3, 3):
  384.             for tool in ['gunzip', 'wget']:
  385.                 path = shutil.which(tool)
  386.                 if path is None:
  387.                     superPrint("error", "Missing dependency!", "The <b>'" + tool + "'</b> tool is not available, please install it!")
  388.                     return False
  389.     return True
  390. # ==============================================================================
  391. # ==== Main program (execution starts here) ====================================
  392. # ==============================================================================
  393. ExitCode = 2
  394. # ==== Argument parsing
  395. # Get OpenSubtitlesDownload.py script absolute path
  396. if os.path.isabs(sys.argv[0]):
  397.     scriptPath = sys.argv[0]
  398. else:
  399.     scriptPath = os.getcwd() + "/" + str(sys.argv[0])
  400. # Setup ArgumentParser
  401. parser = argparse.ArgumentParser(prog='OpenSubtitlesDownload.py',
  402.                                  description='Automatically find and download the right subtitles for your favorite videos!',
  403.                                  formatter_class=argparse.RawTextHelpFormatter)
  404. parser.add_argument('--cli', help="Force CLI mode", action='store_true')
  405. parser.add_argument('-g', '--gui', help="Select the GUI you want from: auto, kde, gnome, cli (default: auto)")
  406. parser.add_argument('-l', '--lang', help="Specify the language in which the subtitles should be downloaded (default: eng).\nSyntax:\n-l eng,fre: search in both language\n-l eng -l fre: download both language", nargs='?', action='append')
  407. parser.add_argument('-i', '--skip', help="Skip search if an existing subtitles file is detected", action='store_true')
  408. parser.add_argument('-s', '--search', help="Search mode: hash, filename, hash_then_filename, hash_and_filename (default: hash_then_filename)")
  409. parser.add_argument('-t', '--select', help="Selection mode: manual, default, auto")
  410. parser.add_argument('-a', '--auto', help="Trigger automatic selection and download of the best subtitles found", action='store_true')
  411. parser.add_argument('-o', '--output', help="Override subtitles download path, instead of next their video file")
  412. parser.add_argument('filePathListArg', help="The video file(s) for which subtitles should be searched and downloaded", nargs='+')
  413. # Only use ArgumentParser if we have arguments...
  414. if len(sys.argv) > 1:
  415.     result = parser.parse_args()
  416.     # Handle results
  417.     if result.cli:
  418.         opt_gui = 'cli'
  419.     if result.gui:
  420.         opt_gui = result.gui
  421.     if result.search:
  422.         opt_search_mode = result.search
  423.     if result.skip:
  424.         opt_search_overwrite = 'off'
  425.     if result.select:
  426.         opt_selection_mode = result.select
  427.     if result.auto:
  428.         opt_selection_mode = 'auto'
  429.     if result.output:
  430.         opt_output_path = result.output
  431.     if result.lang:
  432.         if opt_languages != result.lang:
  433.             opt_languages = result.lang
  434.             opt_selection_language = 'on'
  435.             if opt_language_suffix != 'off':
  436.                 opt_language_suffix = 'on'
  437. # GUI auto detection
  438. if opt_gui == 'auto':
  439.     # Note: "ps cax" only output the first 15 characters of the executable's names
  440.     ps = str(subprocess.Popen(['ps', 'cax'], stdout=subprocess.PIPE).communicate()[0]).split('\n')
  441.     for line in ps:
  442.         if ('gnome-session' in line) or ('cinnamon-sessio' in line) or ('mate-session' in line) or ('xfce4-session' in line):
  443.             opt_gui = 'gnome'
  444.             break
  445.         elif 'ksmserver' in line:
  446.             opt_gui = 'kde'
  447.             break
  448. # Sanitize settings
  449. if opt_search_mode not in ['hash', 'filename', 'hash_then_filename', 'hash_and_filename']:
  450.     opt_search_mode = 'hash_then_filename'
  451. if opt_selection_mode not in ['manual', 'default', 'auto']:
  452.     opt_selection_mode = 'default'
  453. if opt_gui not in ['gnome', 'kde', 'cli']:
  454.     opt_gui = 'cli'
  455.     opt_search_mode = 'hash_then_filename'
  456.     opt_selection_mode = 'auto'
  457.     print("Unknown GUI, falling back to an automatic CLI mode")
  458. # ==== Check for the necessary tools (must be done after GUI auto detection)
  459. if dependencyChecker() is False:
  460.     sys.exit(2)
  461. # ==== Get valid video paths
  462. videoPathList = []
  463. if 'result' in locals():
  464.     # Go through the paths taken from arguments, and extract only valid video paths
  465.     for i in result.filePathListArg:
  466.         filePath = os.path.abspath(i)
  467.         if os.path.isdir(filePath):
  468.             # If it is a folder, check all of its files
  469.             for item in os.listdir(filePath):
  470.                 localPath = os.path.join(filePath, item)
  471.                 if checkFileValidity(localPath):
  472.                     videoPathList.append(localPath)
  473.         elif checkFileValidity(filePath):
  474.             # If it is a valid file, use it
  475.             videoPathList.append(filePath)
  476. else:
  477.     superPrint("error", "No file provided!", "No file provided!")
  478.     sys.exit(2)
  479. # If videoPathList is empty, abort!
  480. if not videoPathList:
  481.     parser.print_help()
  482.     sys.exit(1)
  483. # Check if the subtitles files already exists
  484. if opt_search_overwrite == 'off':
  485.     videoPathList = [path for path in videoPathList if not checkSubtitlesExists(path)]
  486.     # If videoPathList is empty, exit!
  487.     if not videoPathList:
  488.         sys.exit(1)
  489. # ==== Instances dispatcher ====================================================
  490. # The first video file will be processed by this instance
  491. videoPath = videoPathList[0]
  492. videoPathList.pop(0)
  493. # The remaining file(s) are dispatched to new instance(s) of this script
  494. for videoPathDispatch in videoPathList:
  495.     # Handle current options
  496.     command = sys.executable + " " + scriptPath + " -g " + opt_gui + " -s " + opt_search_mode + " -t " + opt_selection_mode
  497.     if not (len(opt_languages) == 1 and opt_languages[0] == 'eng'):
  498.         for resultlangs in opt_languages:
  499.             command += " -l " + resultlangs
  500.     # Split command string
  501.     command_splitted = command.split()
  502.     # The videoPath filename can contain spaces, but we do not want to split that, so add it right after the split
  503.     command_splitted.append(videoPathDispatch)
  504.     # Do not spawn too many instances at once
  505.     time.sleep(0.33)
  506.     if opt_gui == 'cli' and opt_selection_mode != 'auto':
  507.         # Synchronous call
  508.         process_videoDispatched = subprocess.call(command_splitted)
  509.     else:
  510.         # Asynchronous call
  511.         process_videoDispatched = subprocess.Popen(command_splitted)
  512. # ==== Search and download subtitles ===========================================
  513. try:
  514.     # ==== Connection to OpenSubtitlesDownload
  515.     try:
  516.         session = osd_server.LogIn(osd_username, osd_password, osd_language, 'opensubtitles-download 4.1')
  517.     except Exception:
  518.         # Retry once after a delay (could just be a momentary overloaded server?)
  519.         time.sleep(3)
  520.         try:
  521.             session = osd_server.LogIn(osd_username, osd_password, osd_language, 'opensubtitles-download 4.1')
  522.         except Exception:
  523.             superPrint("error", "Connection error!", "Unable to reach opensubtitles.org servers!\n\nPlease check:\n- Your Internet connection status\n- www.opensubtitles.org availability\n- Your downloads limit (200 subtitles per 24h)\n\nThe subtitles search and download service is powered by opensubtitles.org. Be sure to donate if you appreciate the service provided!")
  524.             sys.exit(2)
  525.     # Connection refused?
  526.     if session['status'] != '200 OK':
  527.         superPrint("error", "Connection error!", "Opensubtitles.org servers refused the connection: " + session['status'] + ".\n\nPlease check:\n- Your Internet connection status\n- www.opensubtitles.org availability\n- Your downloads limit (200 subtitles per 24h)\n\nThe subtitles search and download service is powered by opensubtitles.org. Be sure to donate if you appreciate the service provided!")
  528.         sys.exit(2)
  529.     # Count languages marked for this search
  530.     searchLanguage = 0
  531.     searchLanguageResult = 0
  532.     for SubLanguageID in opt_languages:
  533.         searchLanguage += len(SubLanguageID.split(','))
  534.     searchResultPerLanguage = [searchLanguage]
  535.     # ==== Get file hash, size and name
  536.     videoTitle = ''
  537.     videoHash = hashFile(videoPath)
  538.     videoSize = os.path.getsize(videoPath)
  539.     videoFileName = os.path.basename(videoPath)
  540.     # ==== Search for available subtitles on OpenSubtitlesDownload
  541.     for SubLanguageID in opt_languages:
  542.         searchList = []
  543.         subtitlesList = {}
  544.         if opt_search_mode in ('hash', 'hash_then_filename', 'hash_and_filename'):
  545.             searchList.append({'sublanguageid':SubLanguageID, 'moviehash':videoHash, 'moviebytesize':str(videoSize)})
  546.         if opt_search_mode in ('filename', 'hash_and_filename'):
  547.             searchList.append({'sublanguageid':SubLanguageID, 'query':videoFileName})
  548.         ## Primary search
  549.         try:
  550.             subtitlesList = osd_server.SearchSubtitles(session['token'], searchList)
  551.         except Exception:
  552.             # Retry once after a delay (we are already connected, the server may be momentary overloaded)
  553.             time.sleep(3)
  554.             try:
  555.                 subtitlesList = osd_server.SearchSubtitles(session['token'], searchList)
  556.             except Exception:
  557.                 superPrint("error", "Search error!", "Unable to reach opensubtitles.org servers!\n<b>Search error</b>")
  558.         #if (opt_search_mode == 'hash_and_filename'):
  559.         #    TODO Cleanup duplicate between moviehash and filename results
  560.         ## Fallback search
  561.         if ((opt_search_mode == 'hash_then_filename') and (('data' in subtitlesList) and (not subtitlesList['data']))):
  562.             searchList[:] = [] # searchList.clear()
  563.             searchList.append({'sublanguageid':SubLanguageID, 'query':videoFileName})
  564.             subtitlesList.clear()
  565.             try:
  566.                 subtitlesList = osd_server.SearchSubtitles(session['token'], searchList)
  567.             except Exception:
  568.                 # Retry once after a delay (we are already connected, the server may be momentary overloaded)
  569.                 time.sleep(3)
  570.                 try:
  571.                     subtitlesList = osd_server.SearchSubtitles(session['token'], searchList)
  572.                 except Exception:
  573.                     superPrint("error", "Search error!", "Unable to reach opensubtitles.org servers!\n<b>Search error</b>")
  574.         ## Parse the results of the XML-RPC query
  575.         if ('data' in subtitlesList) and (subtitlesList['data']):
  576.             # Mark search as successful
  577.             searchLanguageResult += 1
  578.             subtitlesSelected = ''
  579.             # If there is only one subtitles (matched by file hash), auto-select it (except in CLI mode)
  580.             if (len(subtitlesList['data']) == 1) and (subtitlesList['data'][0]['MatchedBy'] == 'moviehash'):
  581.                 if opt_selection_mode != 'manual':
  582.                     subtitlesSelected = subtitlesList['data'][0]['SubFileName']
  583.             # Get video title
  584.             videoTitle = subtitlesList['data'][0]['MovieName']
  585.             # Title and filename may need string sanitizing to avoid zenity/kdialog handling errors
  586.             if opt_gui != 'cli':
  587.                 videoTitle = videoTitle.replace('"', '\\"')
  588.                 videoTitle = videoTitle.replace("'", "\'")
  589.                 videoTitle = videoTitle.replace('`', '\`')
  590.                 videoTitle = videoTitle.replace("&", "&")
  591.                 videoFileName = videoFileName.replace('"', '\\"')
  592.                 videoFileName = videoFileName.replace("'", "\'")
  593.                 videoFileName = videoFileName.replace('`', '\`')
  594.                 videoFileName = videoFileName.replace("&", "&")
  595.             # If there is more than one subtitles and opt_selection_mode != 'auto',
  596.             # then let the user decide which one will be downloaded
  597.             if not subtitlesSelected:
  598.                 # Automatic subtitles selection?
  599.                 if opt_selection_mode == 'auto':
  600.                     subtitlesSelected = selectionAuto(subtitlesList)
  601.                 else:
  602.                     # Go through the list of subtitles and handle 'auto' settings activation
  603.                     for item in subtitlesList['data']:
  604.                         if opt_selection_match == 'auto':
  605.                             if opt_search_mode == 'hash_and_filename':
  606.                                 opt_selection_match = 'on'
  607.                         if opt_selection_language == 'auto':
  608.                             if searchLanguage > 1:
  609.                                 opt_selection_language = 'on'
  610.                         if opt_selection_hi == 'auto':
  611.                             if item['SubHearingImpaired'] == '1':
  612.                                 opt_selection_hi = 'on'
  613.                         if opt_selection_rating == 'auto':
  614.                             if item['SubRating'] != '0.0':
  615.                                 opt_selection_rating = 'on'
  616.                         if opt_selection_count == 'auto':
  617.                             opt_selection_count = 'on'
  618.                     # Spaw selection window
  619.                     if opt_gui == 'gnome':
  620.                         subtitlesSelected = selectionGnome(subtitlesList)
  621.                     elif opt_gui == 'kde':
  622.                         subtitlesSelected = selectionKde(subtitlesList)
  623.                     else: # CLI
  624.                         subtitlesSelected = selectionCLI(subtitlesList)
  625.             # If a subtitles has been selected at this point, download it!
  626.             if subtitlesSelected:
  627.                 subIndex = 0
  628.                 subIndexTemp = 0
  629.                 # Select the subtitles file to download
  630.                 for item in subtitlesList['data']:
  631.                     if item['SubFileName'] == subtitlesSelected:
  632.                         subIndex = subIndexTemp
  633.                         break
  634.                     else:
  635.                         subIndexTemp += 1
  636.                 subLangId = opt_language_separator  + subtitlesList['data'][subIndex]['ISO639']
  637.                 subLangName = subtitlesList['data'][subIndex]['LanguageName']
  638.                 subURL = subtitlesList['data'][subIndex]['SubDownloadLink']
  639.                 subEncoding = subtitlesList['data'][subIndex]['SubEncoding']
  640.                 subPath = videoPath.rsplit('.', 1)[0] + '.' + subtitlesList['data'][subIndex]['SubFormat']
  641.                 if opt_output_path and os.path.isdir(os.path.abspath(opt_output_path)):
  642.                     subPath = os.path.abspath(opt_output_path) + "/" + subPath.rsplit('/', 1)[1]
  643.                 # Write language code into the filename?
  644.                 if ((opt_language_suffix == 'on') or (opt_language_suffix == 'auto' and searchLanguageResult > 1)):
  645.                     subPath = videoPath.rsplit('.', 1)[0] + subLangId + '.' + subtitlesList['data'][subIndex]['SubFormat']
  646.                 # Escape non-alphanumeric characters from the subtitles path
  647.                 if opt_gui != 'cli':
  648.                     subPath = re.escape(subPath)
  649.                 # Make sure we are downloading an UTF8 encoded file
  650.                 downloadPos = subURL.find("download/")
  651.                 if downloadPos > 0:
  652.                     subURL = subURL[:downloadPos+9] + "subencoding-utf8/" + subURL[downloadPos+9:]
  653.                 ## Download and unzip the selected subtitles (with progressbar)
  654.                 if opt_gui == 'gnome':
  655.                     process_subtitlesDownload = subprocess.call("(wget -q -O - " + subURL + " | gunzip > " + subPath + ") 2>&1" + ' | (zenity --auto-close --progress --pulsate --title="Downloading subtitles, please wait..." --text="Downloading <b>' + subtitlesList['data'][subIndex]['LanguageName'] + '</b> subtitles for <b>' + videoTitle + '</b>...")', shell=True)
  656.                 elif opt_gui == 'kde':
  657.                     process_subtitlesDownload = subprocess.call("(wget -q -O - " + subURL + " | gunzip > " + subPath + ") 2>&1", shell=True)
  658.                 else: # CLI
  659.                     print(">> Downloading '" + subtitlesList['data'][subIndex]['LanguageName'] + "' subtitles for '" + videoTitle + "'")
  660.                     if sys.version_info >= (3, 0):
  661.                         tmpFile1, headers = urllib.request.urlretrieve(subURL)
  662.                         tmpFile2 = gzip.GzipFile(tmpFile1)
  663.                         byteswritten = open(subPath, 'wb').write(tmpFile2.read())
  664.                         if byteswritten > 0:
  665.                             process_subtitlesDownload = 0
  666.                         else:
  667.                             process_subtitlesDownload = 1
  668.                     else: # python 2
  669.                         tmpFile1, headers = urllib.urlretrieve(subURL)
  670.                         tmpFile2 = gzip.GzipFile(tmpFile1)
  671.                         open(subPath, 'wb').write(tmpFile2.read())
  672.                         process_subtitlesDownload = 0
  673.                 # If an error occurs, say so
  674.                 if process_subtitlesDownload != 0:
  675.                     superPrint("error", "Subtitling error!", "An error occurred while downloading or writing <b>" + subtitlesList['data'][subIndex]['LanguageName'] + "</b> subtitles for <b>" + videoTitle + "</b>.")
  676.                     osd_server.LogOut(session['token'])
  677.                     sys.exit(2)
  678.     ## Print a message if no subtitles have been found, for any of the languages
  679.     if searchLanguageResult == 0:
  680.         superPrint("info", "No subtitles available :-(", '<b>No subtitles found</b> for this video:\n<i>' + videoFileName + '</i>')
  681.         ExitCode = 1
  682.     else:
  683.         ExitCode = 0
  684. except (OSError, IOError, RuntimeError, TypeError, NameError, KeyError):
  685.     # Do not warn about remote disconnection # bug/feature of python 3.5?
  686.     if "http.client.RemoteDisconnected" in str(sys.exc_info()[0]):
  687.         sys.exit(ExitCode)
  688.     # An unknown error occur, let's apologize before exiting
  689.     superPrint("error", "Unexpected error!", "OpenSubtitlesDownload encountered an <b>unknown error</b>, sorry about that...\n\n" + \
  690.                "Error: <b>" + str(sys.exc_info()[0]).replace('<', '[').replace('>', ']') + "</b>\n" + \
  691.                "Line: <b>" + str(sys.exc_info()[-1].tb_lineno) + "</b>\n\n" + \
  692.                "Just to be safe, please check:\n- www.opensubtitles.org availability\n- Your downloads limit (200 subtitles per 24h)\n- Your Internet connection status\n- That are using the latest version of this software ;-)")
  693. except Exception:
  694.     # Catch unhandled exceptions but do not spawn an error window
  695.     print("Unexpected error (line " + str(sys.exc_info()[-1].tb_lineno) + "): " + str(sys.exc_info()[0]))
  696. # Disconnect from opensubtitles.org server, then exit
  697. if session and session['token']:
  698.     osd_server.LogOut(session['token'])
  699. sys.exit(ExitCode)

Все что ему нужно — указать файл для которого мы хотим найти сабы, и пару параметров отвечающих за сами сабы (язык, обновлять не обновлять и т.д.). Так как мы исходим из того, что торрент-файлы у нас качаются автоматически, то и этот скрипт применять к файлам лучше скриптом, добавленным в крон. Скрипт простецкий:

/etc/cron.daily/download-subtitle
 
  1. #!/bin/bash
  2. path="/share/torrents/xa/"
  3. download_sub="/opt/OpenSubtitlesDownload.py --cli --lang eng --lang rus --skip  --auto "
  4. rmd="rm -rf "
  5. find "${path}" -size  50M -type f  -exec ${download_sub} {} \;
  6. find "${path}" -empty -type d  -exec ${rmd} {} \;

Этот скрипт проверяет все файлы в нашем каталоге /share/torrents/xa/, находит файлы больше 50 мегабайт (потому что иногда в торрентах содержится не только видеофайл, но и какой-нибудь сопровождающий файл с описанием релиза, да и сами субтитры, которые скачались в прошлый раз, нас не интересуют) и натравливает на каждый их них скрипт поиска субтитров. Если субтитры указанных языков (русский английский) найдены — они скачиваются. Также скрипт удаляет пустые каталоги, которые иногда образуются лично у меня после переноса новых серий на постоянное место жительства.

В итоге

Мы получаем уютный сервачок, который сам по себе живет и поставляет к нашему столу свежие серии. Работает исправно на все 95%, осечки случаются, но как правило это связано с некорректным названием торрентов (рукожопы случаются) или отсутствием субтитров на opensubtitles (если я нахожу сабы на стороне, стараюсь их добавить и туда).

Скрипт для поднятия SOCKS-прокси посредством ssh с проверкой его работоспособности

Небольшой скрипт, которым я пользуюсь для поднятия прокси-через-ssh. Висит в автозагрузке, постоянно проверяет при помощи курла доступность гугла, в случае недоступности — прибивает нужное ssh-соединение и открывает его снова.

ЗЫ: свой собственный прокси с шифрованием трафика средствами ssh — рекомендации лучших собаководов )

proxy.sh
 
  1. #!/bin/sh
  2. # establishes an SSH Socks proxy and reconnects if it fails.
  3. socksPort=8376
  4. server=example.com
  5. user=myproxyuser
  6. key=~/.ssh/id_rsa_myproxyuser
  7. while true
  8. do
  9.     timeout 20 curl --retry-max-time 1 --retry 5 --retry-delay 1 -x socks5://127.0.0.1:${socksPort} http://google.com/ > /dev/null 2>&1
  10.     if [ $? -ne 0 ]
  11.     then
  12.         echo $(date) reconnect...
  13.         while ps -eo pid,cmd | grep ssh | grep ${socksPort}
  14.         do
  15.             kill $(ps -eo pid,cmd | grep ssh | grep ${socksPort} | awk '{print $1}' | head -n 1)
  16.         done;
  17.         ssh -D ${socksPort} -f  -q -N -i "${key}" ${user}@${server}
  18.     else
  19.         sleep 10
  20.     fi
  21. done;

Вариант для cygwin

proxy_cygwin.sh
 
  1. #!/bin/sh
  2. # establishes an SSH Socks proxy and reconnects if it fails.
  3. socksPort=8376
  4. server=example.com
  5. user=myproxyuser
  6. key=~/.ssh/id_rsa_myproxyuser
  7. while true
  8. do
  9.     timeout 20  curl -x socks5://127.0.0.1:${socksPort} http://google.com/  > /dev/null 2>&1
  10.     if [ $? -ne 0 ]
  11.     then
  12.         while ps -e | grep ssh;
  13.         do
  14.             # /bin/kill - is important!
  15.             /bin/kill -f $(grep -a "ssh" /proc/*/cmdline  | grep -a  ${socksPort} | awk -F '/' '{print $3}' | head -n 1)
  16.         done;
  17.         echo $(date) reconnect
  18.         ssh -D ${socksPort} -fNq -i "${key}" ${user}@${server}
  19.     else
  20.         sleep 10
  21.     fi
  22. done;

Написал поисковик для файлопомоек — pyFileSearcher

По работе нужно было внести ясность в постоянно убывающее место на файловых серверах, на которые пользователи любят сгружать всякий мусор, не относящийся к работе. Столкнувшись с такой необходимостью, полез искать софт и выяснил, что хотя индексаторов в целом довольно много, но они или перегружены функционалом и нацелены на домашнего пользователя — такие просто не справляются с большим объемом файлов; или являются какими-то безумными корпоративными системами, которые выглядят страшно шописец, ставятся как отдельный сервер с разворачиваемыми агентами и настраиваются так, что без поллитры не разобраться.

В общем, я решил что было бы прикольно написать что-то свое. Эту мысль я вынашивал наверное больше года, так как яжнепрограммист ну абсолютно, но вот прошел курс по гуям в питоне и подумал что надо бы попробовать че получится.

Получилось портабельное приложение, которое не обладает горой функционала, но во-первых умеет сожрать в себя 20 миллионов файлов, во-вторых — умеет искать по нужным в быту параметрам, таким как размер файла, тип, и — это важно — дате добавления в индекс. Строго говоря я не видел тулзов, которые бы сами запоминали время, когда файл был обнаружен. Да, у файла есть время создания и время модификации — и казалось бы их должно хватать для отфильтровывания новых файлов, когда мы хотим их найти. Но хрен там был, эти атрибуты ведут себя черт знает как — например файл притащенный с плеера может показать какой-нить 1700й год до нашей эры.

В общем ладно, это все лирика, вот что вышло:

Аскетично, но работает. Прожка может запускаться с ключом, который стартует сканирование, так что можно запускать его раз в сутки по шедулеру и потом смотреть — что же пользователи накидали за прошедшую неделю, нет ли свежих релизов с рутрекера ))

При скролле результатов отсутствующие файлы подсвечиваются красным, список можно сохранить в csv чтобы предъявить владельцу каталога на сервере или его начальнику =) Фильтры поиска можно сохранять (обычно мне нужны медиафайлы размером не менее, список расширений прилагается, в индексе появились за неделю)

Вся эта балалайка разумеется умеет работать под виндой, но и линукс не забыл (была бы макось под рукой, тестил бы код еще и под маком). В качестве базы данных можно использовать или sqlite, базы которого можно рожать прямо из проги, или подключиться к MySQL — мой случай, 20 лямов записей sqlite тупо не вывозит (собственно это проблема большинства несложных индексаторов, какие можно найти в инете)

В общем получилось такое промежуточное решение — простенькое и на скорую руку, не требующее воскуривания мануалов перед использованием, но и не умирающее от большого файлсервера. Да, поиск внутри файлов не умеет, как и кучу других плюшек, так что для домашнего использования скорее всего не пригодится, но мою задачу решает лучше чем что-то похожее, что я использовал (Locate32 — от его интерфейса и возможностей я отталкивался, но он с некоторой периодичностью терял конфиг, жрал под гиг оперативки из-за использования локальных баз, и был виндуз-онли. Хотя в целом прога более чем годная). Так что вот он, первый релиз: https://github.com/qiwichupa/pyFileSearcher/releases также залил на сурсфордж.

Думаю еще пару фишек потом добавить, типа поиска по файлам которые были удалены, потому что оно бывает нужно. Но это как будет время и желание — базовые мои хотелки оно уже удовлетворяет, может кому пригодится тоже =)

CyrTranscoder — свой велосипед для борьбы с кракозябрами

В качестве лишней практики написал перекодировщик кракозябр, наподобие старой-доброй утилки «Штирлиц».

Утилка жрет текст построчно и пытается угадать какая пара кодировок была закосячена. Существует в двух вариантах: с графическим интерфейсом и консольный вариант. Оба варианта — просто скрипты на питоне, но для удобства пользования для винды собран гуевый бинарник.

Скачать можно на гитхабе: https://github.com/qiwichupa/cyrtranscode/releases

Папка windows\temp забивается файлами cab_xxxx

Данная проблема вызвана сбоем службы автоматического обновления Windows, в частности при работе с серверами обновлений WSUS.

Пошаговое решение проблемы выглядит так:

  1. Остановка службы обновлений (wuauserv)
  2. Остановка службы trustedinstaller
  3. Удаление содержимого папки c:\windows\temp
  4. Удаление cab-файлов из папки c:\windows\logs\CBS
  5. Удаление папки  C:\windows\softwaredistribution
  6. Запуск сервиса trustedinstaller
  7. Запуск службы обновления

Для удаленного автоматического решения проблемы можно воспользоваться скриптом:

fix_winupdate_tmp_cab.ps1
 
  1. $Machine = read-host "Type in the Computer Name"
  2. $windowsUpdateService = 'wuauserv'
  3. $trustedInstallerService = 'trustedinstaller'
  4. function Set-ServiceState
  5. {
  6.     [CmdletBinding()]
  7.     param(
  8.         [string]$ComputerName,
  9.         [string]$ServiceName
  10.     )
  11.     Write-Verbose "Evaluating $ServiceName on $ComputerName."
  12.     [string]$WaitForIt = ""
  13.     [string]$Verb = ""
  14.     [string]$Result = "FAILED"
  15.     $svc = Get-Service -computername $ComputerName -name $ServiceName
  16.     Switch ($svc.status) {
  17.         'Stopped' {
  18.             Write-Verbose "[$ServiceName] is currently Stopped. Starting."
  19.             $Verb = "start"
  20.             $WaitForIt = 'Running'
  21.             $svc.Start()
  22.         }
  23.         'Running' {
  24.             Write-Verbose "[$ServiceName] is Running. Stopping."
  25.             $Verb = "stop"
  26.             $WaitForIt = 'Stopped'
  27.             $svc.Stop()
  28.         }
  29.         default {
  30.             Write-Verbose "$ServiceName is $($svc.status). Taking no action."
  31.         }
  32.     }
  33.     if ($WaitForIt -ne "") {
  34.         Try { # For some reason, we cannot use -ErrorAction after the next statement:
  35.             $svc.WaitForStatus($WaitForIt,'00:02:00')
  36.         } Catch {
  37.             Write-Warning "After waiting for 2 minutes, $ServiceName failed to $Verb."
  38.         }
  39.         $svc = (get-service -computername $ComputerName -name $ServiceName)
  40.         if ($svc.status -eq $WaitForIt) {
  41.             $Result = 'SUCCESS'
  42.         }
  43.         Write-Verbose "$Result - $ServiceName on $ComputerName is $($svc.status)"
  44.         Write-Verbose ("{0} - {1} on {2} is {4}" -f $Result, $ServiceName, $ComputerName, $svc.status)
  45.     }
  46. }
  47. # stop update service
  48. Write-Host "stop update service"
  49. Set-ServiceState -ComputerName $Machine -ServiceName $windowsUpdateService -Verbose
  50. #removes temp files and renames software distribution folder
  51. Write-Host "removes temp files and renames software distribution folder"
  52. Remove-Item \\$Machine\c$\windows\temp\* -recurse
  53. Rename-Item \\$Machine\c$\windows\SoftwareDistribution SoftwareDistribution.old
  54. #restarts update service
  55. Write-Host "restarts update service"
  56. Set-ServiceState -ComputerName $Machine -ServiceName $windowsUpdateService
  57. #removes software distribution.old
  58. Write-Host "removes software distribution.old"
  59. Remove-Item \\$Machine\c$\windows\SoftwareDistribution.old -recurse
  60. #stops trustedinstaller service
  61. Write-Host "stops trustedinstaller service"
  62. Set-ServiceState -ComputerName $Machine -ServiceName $trustedInstallerService
  63. #removes cab files from trustedinstaller
  64. Write-Host "removes cab files from trustedinstaller"
  65. remove-item \\$Machine\c$\windows\Logs\CBS\* -recurse
  66. #restarts trustedinstaller service
  67. Write-Host "restarts trustedinstaller service"
  68. Set-ServiceState -ComputerName $Machine -ServiceName $trustedInstallerService
  69. #rebuilds cab files from WSUS
  70. Write-Host "rebuilds cab files from WSUS"
  71. invoke-command -ComputerName $Machine -ScriptBlock { & cmd.exe "c:\windows\system32\wuauclt.exe /detectnow" }

Источник: https://community.spiceworks.com/topic/495234-windows-temp-file-is-full-of-cab_xxxx-files-on-windows-server-2008-r2