Апрель 2021 — КiwiблоG

Google translate — что там с качеством перевода

Автор: qiwichupa | 2021-04-28 - 13:27 |2024-11-24 из сети

Прошло 3 года с последнего теста Google Translate (посвященного их нейросети, которая с 2017го года должна эпически улучшать качество перевода). Для этого я сделал несколько прямых и обратных переводов — пришло время повторить!

Как и в прошлые разы — перевод туда и обратно.

Download [16.21 KB]

WordPress: как убрать &nbsp в конце постов.

Автор: qiwichupa | 2021-04-28 - 10:56 |2024-11-24 техноблог

Оставить комментарий

Совершенно загадочная бага в классическом редакторе вордпресса, выраженная в автоматическом добавлении новой строки и неразрывного пробела в конец поста при каждом его сохранении, лечится следующими путями.

Для лечения уже существующих постов без изменения базы данных, добавляем в functions.php вашей темы следующий код

Загрузка...

Слишком долго?

Перезагрузить документ

Открыть в новой вкладке

Download

Вторая часть — обработка поста при сохранении. Почти тот же кусок кода

Загрузка...

Слишком долго?

Перезагрузить документ

Открыть в новой вкладке

Download

Обратите внимание, что смайлик тут используется как символ, заведомо неиспользуемый в постах — в процессе он будет заменен на неразрывный пробел. Это нужно учитывать, если такой символ может появиться в посте «легально».

Чтобы лишний раз не ковырять дефолтный functions.php, можно установить плагин Functionality. Он создаст дополнительный файл с таким же названием и установит его как плагин с именем блога (да, установив этот плагин вы автоматом получите второй — не забудьте активировать и его тоже).

Классный скрипт для конвертации в utf8

Автор: qiwichupa | 2021-04-26 - 11:17 |2024-11-24 техноблог

Оставить комментарий

Запарило пересохранять субтитры, которые часто выкладывают в вин-кодировке. Нашел клевый скрипт на питоне (а значит и под виндой можно юзать) для конвертации из любой кодировки (исходная автоопределяется) в UTF8. Навесил его как кастомную команду для *.srt в Double Commander, который также юзаю в обеих системах — стало совсем хорошо =)

#!/usr/bin/env python3
import os
import sys
from chardet import detect
srcfile = sys.argv[1]
tmpfile = sys.argv[1] + '.tmp'
bakfile = sys.argv[1] + '.bak'
# get file encoding type
def get_encoding_type(file):
    with open(file, 'rb') as f:
        rawdata = f.read()
    return detect(rawdata)['encoding']
from_codec = get_encoding_type(srcfile)
# add try: except block for reliability
try: 
    with open(srcfile, 'r', encoding=from_codec) as f, open(tmpfile, 'w', encoding='utf-8') as e:
        text = f.read() # for small files, for big use chunks
        e.write(text)
    os.rename(srcfile, bakfile) # backup old encoding file
    os.rename(tmpfile, srcfile) # rename new encoding
    
except UnicodeDecodeError:
    print('Decode Error')
except UnicodeEncodeError:
    print('Encode Error')

Сброс пароля на хосте VMware ESXi

Автор: qiwichupa | 2021-04-21 - 15:37 |2024-11-24 техноблог

Оставить комментарий

Для сброса пароля хоста ESXi понадобится доступ к серверу (физический, или через iLO-подобные системы управления) и Live CD с каким-нибудь линуксом (я использую GParted Live).

1. Загрузившись с Live CD, проверим какие диски и разделы нам доступны. Скорее всего найдется единственный диск с 9-ю разделами на нем

ls /dev| grep sd

sda
sda1
sda2
sda3
sda4
sda5
sda6
sda7
sda8
sda9

2. Пароль находится в архиве в архиве (да, два раза) на разделе sda5. Смонтируем раздел и проверим.

mkdir /mnt/sda5
mount /dev/sda5 /mnt/sda5
ls -l /mnt/sda5/state.tgz

-rwxr-xr-x 1 root root 12969 Apr 21 10:42 /mnt/sda5/state.tgz

3. Создадим временную директорию и распакуем в нее этот файл

mkdir /tmp/state
tar -xf /mnt/sda5/state.tgz -C /tmp/state/
# из архива вылез второй архив, распакуем его сюда же
tar -xf /tmp/state/local.tgz -C /tmp/state/
# удалим этот промежуточный архив
rm /tmp/state/local.tgz

4. Отредактируем файл shadow

vi /tmp/state/etc/shadow

уберем из первой строки длинный хеш пароля, идущий после «root:», чтобы строка приняла вид

root::13358:0:99999:7:::

Таким образом пароль для рута будет не установлен. Сохраним файл.

5. Теперь остается запаковать все обратно в архивы и положить на место

cd /tmp/state
tar -czf local.tgz etc
tar -czf state.tgz local.tgz
mv state.tgz /mnt/sda5/

6. Отмонтируем раздел ESXi и перезагружаемся

umount /mnt/sda5
reboot

После перезагрузки можно будет зайти в ESXi без пароля и установить его в настройках.

Небольшая демонстрация.

mergerfs: прозрачное объединение дисков (файловых систем)

Автор: qiwichupa | 2021-04-10 - 13:44 |2024-11-24 техноблог

Оставить комментарий

Сегодня хочу рассказать о достаточно нетипичном решении для объединения дисков в один массив. Начну с юзкейса.

У меня есть домашняя файлопомойка, которая построена на классическим RAID5. Инфа на ней хранится, прямо скажем, не критической важности, но все же я предпочитаю ее иногда бэкапить, чтобы хотя бы копия за прошлый год у меня где-то валялась. Разумеется, мне не хочется тратить большие деньги на бэкапные диски, поэтому, как правило, это старые, относительно небольшого объема, разнокалиберные харды из серии «что было под рукой».

Понятно, что классическим способом получения большого тома из нескольких дисков, является объединение их через LVM, или сборка RAID0. Однако, учитывая,что диски старые и посыпаться могут, например, на этапе восстановления информации с них, мне бы не хотелось рисковать всем таким массивом. Хотелось бы объединить диски в него так, чтобы каждый отдельный диск нес на себе самостоятельную файловую систему, которую можно было бы смонтировать отдельно. Допустим, в массиве из 3х дисков один умер — я смонтировал два оставшихся диска отдельно и спокойно скопировал с них инфу.

Удивительно, но когда я полез гуглить такую хотелку, оказалось, что решение уже придумано и называется mergerfs.

Работает оно ровно так — вы монтируете ваши диски по отдельности, а потом при помощи утилиты mergerfs объединяете их в виртуальную фс.

mergerfs -o defaults,allow_other,use_ino,category.create=mfs,moveonenospc=true,minfreespace=1M  /tmp/backups/vol1:/tmp/backups/vol2 /backup

При этом файлы пишутся то на один диск, то на второй, для балансировки свободного места. При этом любой конкретный файл будет лежать только на одном реальном диске и его можно будет с него прочитать.

df -h | egrep "Filesystem|backup"

Filesystem                                      Size  Used Avail Use% Mounted on
/dev/mapper/backup-backup                       3.6T  2.6T  858G  76% /tmp/backups/vol1
/dev/mapper/backup2-backup                      916G   12G  858G   2% /tmp/backups/vol2
vol1:vol2                                       4.5T  2.6T  1.7T  61% /backup

ls /tmp/backups/vol1/Public/Video/Movies/Qatsi_Trilogy/

'1. Koyaanisqatsi (1982) 1080p.mkv'

ls /tmp/backups/vol2/Public/Video/Movies/Qatsi_Trilogy/

'2. Powaqqatsi (1988) 1080p.mkv'

ls /backup/Public/Video/Movies/Qatsi_Trilogy/

'1. Koyaanisqatsi (1982) 1080p.mkv' '2. Powaqqatsi (1988) 1080p.mkv'

Как можно видеть: на одном смонтированном томе виден один файл, на втором — второй, а в точке монтирования mergerfs — оба.

Схема из man mergerfs:

              A                B        =       C
              /disk1           /disk2           /merged
              |                |                |
               -- /dir1         -- /dir1         -- /dir1
              |   |            |   |            |   |
              |    -- file1    |    -- file2    |    -- file1
              |                |    -- file3    |    -- file2
               -- /dir2        |                |    -- file3
              |   |             -- /dir3        |
              |    -- file4        |             -- /dir2
              |                      -- file5   |   |
               -- file6                         |    -- file4
                                                |
                                                 -- /dir3
                                                |   |
                                                |    -- file5
                                                |
                                                 -- file6

Конечно, нельзя рекомендовать это решение там, где вы имеете надежное оборудование и вам важна скорость — mergerfs работает через fuse, так что в любом случае это компромисс и не замена RAID0. Но в случае подобном моем — это однозначно лучший вариант, который можно придумать.

PS: К слову, mergerfs не единственная виртуальная ФС такого типа. Изначально я наткнутся на mhddfs, которая даже есть в репозитории debian. Однако, как я понял, ее разработка завяла, а вот тут пишут, что в ней есть баги и лучше таки использовать mergerfs.

Borg Backup: Cache is newer than repository.

Автор: qiwichupa | 2021-04-03 - 15:27 |2024-11-24 техноблог

Оставить комментарий

Ошибка:
«Cache is newer than repository — do you have multiple, independently updated repos with same ID?»
может возникнуть, если репозиторий был восстановлен из бэкапа.

Лечится выполнением команды (на стороне клиента)

rm -rf ~/.cache/borg/
mv ~/.config/borg/security{,_bak}

Архив за месяц: Апрель 2021

Google translate — что там с качеством перевода

WordPress: как убрать &nbsp в конце постов.

Классный скрипт для конвертации в utf8

Сброс пароля на хосте VMware ESXi

mergerfs: прозрачное объединение дисков (файловых систем)

Borg Backup: Cache is newer than repository.

Искать

Свежее

Категории