Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/hikiko4ern/vk_dump
VKontakte dumper / сохранение данных из ВКонтакте
https://github.com/hikiko4ern/vk_dump
vk vkontakte
Last synced: 9 days ago
JSON representation
VKontakte dumper / сохранение данных из ВКонтакте
- Host: GitHub
- URL: https://github.com/hikiko4ern/vk_dump
- Owner: hikiko4ern
- License: unlicense
- Archived: true
- Created: 2018-07-12T22:42:24.000Z (over 6 years ago)
- Default Branch: master
- Last Pushed: 2023-09-29T03:00:30.000Z (over 1 year ago)
- Last Synced: 2024-09-21T15:33:50.145Z (4 months ago)
- Topics: vk, vkontakte
- Language: Python
- Homepage:
- Size: 162 KB
- Stars: 26
- Watchers: 7
- Forks: 20
- Open Issues: 9
-
Metadata Files:
- Readme: readme.md
- License: LICENSE
Awesome Lists containing this project
README
## VK Dump Tool
[![](https://img.shields.io/github/release/hikiko4ern/vk_dump.svg?style=flat-square&logo=github&logoColor=white&labelColor=101010&color=2196f3)](https://github.com/hikiko4ern/vk_dump/releases/latest)![](https://img.shields.io/static/v1.svg?message=5.95&logo=vk&logoColor=white&label=API&labelColor=101010&color=a938e4&style=flat-square)
Внимание
## Разработка этого скрипта прекращена. Ещё какое-то время он будет кое-как работать при всех своих багах, пока используемую версию API не прикроют (однако сохранение лайкнутых фото/видео/т.п. скоро [перестанет работать](https://vk.com/api_updates?w=wall-28551727_5754))
На данный момент иногда пользователи определяются как `{unknown user}`. Решения проблемы пока нет ([#24](/../../issues/24)).
## Установка
- склонировать/скачать репозиторий
- установить зависимости## Установка зависимостей
```bash
pip3 install -r requirements.txt
```Для загрузки видео из некоторых сторонних источников (например, RuTube) [`youtube-dl`](https://github.com/ytdl-org/youtube-dl) использует [`ffmpeg`](https://ffmpeg.org), который необходимо установить отдельно.
Если Вы используете Windows ниже 10 версии, дополнительно установите пакет `colorama`:
```bash
pip3 install colorama
```## CLI
Все доступные аргументы можно посмотреть при запуске с `--help`.
Для сохранения нескольких типов данных за один вызов необходимо указывать каждый тип отдельным аргументом `dump`.
Например, для сохранения фото и документов надо запускать `dump.py --dump photo --dump docs`.## Авторизация
Возможны два способа аутентификации - с помощью пары логин-пароль или токена. Авторизация по логину идёт с данными от Kate Mobile.
Для входа по токену необходимо передать аргумент `token` при запуске:
```bash
python3 dump.py --token your_token_here
```## Мультипоточная загрузка
Количество процессов, создаваемых для загрузки, по умолчанию равняется `4*потоки`.
При загрузке видео - числу, заданному в настройках, но не больше количества потоков.
Такое ограничение введено ввиду отсутствия смысла в спаме лишними процессами при загрузке больших по размеру видео (однако лимит всё же убирается через настройки).## Поддерживаемые для сохранения данные
- [x] Фото
- [x] Видео
- [x] Аудио
- [x] Документы
- [x] Диалоги (txt) и вложения (фото, видео, документы, голосовые)
- [x] Вложения понравившихся постов (фото, видео, документы)
- [x] Понравившиеся фотографии
- [x] Понравившиеся видео
- [ ] прочее, прочее, прочее ;)Любые предложения и репорты о багах приветствуются :з
## Настройка сохраняемых диалогов
Для сохранения или исключения определённых диалогов необходимо вручную подредактировать конфиг `settings.ini`.
ID диалогов перечисляются через запятую. Получить его можно, например, открыв диалог в разделе сообщений, тогда в URL вроде `https://vk.com/im?sel=100` идентификатором будет являться кусок, идущий после `sel=`.
Пример исключения диалога с ID `100` и беседы `c60`:
```ini
[EXCLUDED_DIALOGS]
id = 100,c60
```Сохранение только диалога с ID `100` и исключения всех остальных:
```ini
[DUMP_DIALOGS_ONLY]
id = 100
```## Дозапись новых сообщений вместо перезаписывания
Если включена, при кэшировании будут получены не все сообщения, а только с ID больше последнего записанного (последняя строка в файле).
## F.A.Q
**Q: Можно ли не вводить каждый раз логин и пароль (и код 2FA) при авторизации?**\
**A:** Просто передавайте логин аргументом (`--login`) или вводите пустой пароль на экране авторизации. В таком случае данные будут подтянуты из конфига `vk_api`.**Q: Ошибка vk_api.exceptions.AccessDenied: You don't have permissions to browse user's audio**\
**A:** К сожалению, [`vk_api`](https://github.com/python273/vk_api) не поддерживает сохранение аудио при входе по токену. Ну или же попробуйте удалить файл `vk_config.v2.json` и переавторизироваться, если это не Ваш случай ¯\\\_(ツ)\_/¯**Q: Ошибка RegexNotFoundError('Unable to extract %s' % \_name)**\
**A:** Обновите `youtube_dl`: `pip3 install --upgrade youtube_dl`.