Initial commit

2025-11-01 00:10:38 +04:00
parent 596d45c326
commit 84295974d3
8 changed files with 1419 additions and 0 deletions
--- a/audio_processor.py
+++ b/audio_processor.py
@@ -0,0 +1,588 @@
+"""
+Модуль для обработки аудио: изменение скорости и pitch
+"""
+import os
+import json
+import subprocess
+from pathlib import Path
+import logging
+
+logger = logging.getLogger(__name__)
+
+
+class AudioProcessor:
+    """Класс для обработки аудио файлов"""
+    
+    def __init__(self, temp_dir: Path):
+        self.temp_dir = temp_dir
+        self.temp_dir.mkdir(exist_ok=True)
+        self._check_ffmpeg()
+    
+    def _check_ffmpeg(self):
+        """Проверяет наличие ffmpeg в системе"""
+        try:
+            subprocess.run(
+                ['ffmpeg', '-version'],
+                stdout=subprocess.PIPE,
+                stderr=subprocess.PIPE,
+                check=True
+            )
+        except (subprocess.CalledProcessError, FileNotFoundError):
+            logger.warning("ffmpeg не найден. Убедитесь, что ffmpeg установлен в системе.")
+    
+    def _detect_audio_format(self, file_path: Path) -> str:
+        """Определяет формат аудио файла"""
+        try:
+            result = subprocess.run(
+                ['ffprobe', '-v', 'error', '-select_streams', 'a:0',
+                 '-show_entries', 'stream=codec_name', '-of', 'default=noprint_wrappers=1:nokey=1',
+                 str(file_path)],
+                stdout=subprocess.PIPE,
+                stderr=subprocess.PIPE,
+                text=True,
+                timeout=10
+            )
+            if result.returncode == 0:
+                return result.stdout.strip()
+        except Exception as e:
+            logger.debug(f"Не удалось определить формат: {e}")
+        return None
+    
+    def _get_sample_rate(self, file_path: Path) -> int:
+        """Получает sample rate аудио файла"""
+        try:
+            result = subprocess.run(
+                ['ffprobe', '-v', 'error', '-select_streams', 'a:0',
+                 '-show_entries', 'stream=sample_rate', '-of', 'default=noprint_wrappers=1:nokey=1',
+                 str(file_path)],
+                stdout=subprocess.PIPE,
+                stderr=subprocess.PIPE,
+                text=True,
+                timeout=10
+            )
+            if result.returncode == 0:
+                try:
+                    return int(result.stdout.strip())
+                except ValueError:
+                    pass
+        except Exception as e:
+            logger.debug(f"Не удалось получить sample rate: {e}")
+        return None
+    
+    def _get_metadata(self, file_path: Path) -> dict:
+        """Получает все метаданные из аудио файла"""
+        metadata = {}
+        try:
+            # Получаем все метаданные в формате JSON
+            result = subprocess.run(
+                ['ffprobe', '-v', 'error', '-show_entries', 'format_tags=all',
+                 '-of', 'json', str(file_path)],
+                stdout=subprocess.PIPE,
+                stderr=subprocess.PIPE,
+                text=True,
+                timeout=10
+            )
+            if result.returncode == 0:
+                try:
+                    data = json.loads(result.stdout)
+                    tags = data.get('format', {}).get('tags', {})
+                    if tags:
+                        # Копируем все теги
+                        metadata = tags.copy()
+                except (json.JSONDecodeError, KeyError):
+                    pass
+        except Exception as e:
+            logger.debug(f"Не удалось получить метаданные: {e}")
+        return metadata
+    
+    def process_audio(self, input_path: Path, speed_factor: float, output_path: Path, original_filename: str = None) -> bool:
+        """
+        Изменяет скорость и pitch аудио файла
+        
+        Args:
+            input_path: Путь к исходному файлу
+            speed_factor: Коэффициент скорости (1.0 = оригинал, 0.8 = -20%, 1.2 = +20%)
+            output_path: Путь для сохранения обработанного файла
+            original_filename: Оригинальное имя файла (для использования в метаданных, если нет title)
+        
+        Returns:
+            True если успешно, False при ошибке
+        """
+        if not input_path.exists():
+            logger.error(f"Входной файл не существует: {input_path}")
+            return False
+        
+        try:
+            logger.info(f"Обработка аудио: {input_path} -> {output_path} (speed: {speed_factor})")
+            
+            # Определяем формат выходного файла и параметры кодека
+            output_ext = output_path.suffix.lower()
+            codec_params = self._get_codec_params(output_ext)
+            
+            # Получаем текущий sample rate файла
+            current_sr = self._get_sample_rate(input_path)
+            if current_sr is None:
+                # Если не удалось определить, используем стандартный
+                current_sr = 44100
+                logger.warning(f"Не удалось определить sample rate для {input_path}, используем 44100")
+            
+            # Изменяем sample rate - это изменит и скорость, и pitch одновременно
+            # Для одновременного изменения скорости и pitch используем asetrate + aresample
+            # asetrate изменяет скорость воспроизведения и pitch, aresample возвращает к нормальному sample rate
+            new_sample_rate = int(current_sr * speed_factor)
+            
+            # Используем asetrate для изменения скорости/pitch, затем aresample для нормализации sample rate
+            filter_complex = f"asetrate={new_sample_rate},aresample={current_sr}"
+            
+            # Получаем метаданные из исходного файла
+            metadata = self._get_metadata(input_path)
+            
+            # Определяем, что добавить к названию
+            if speed_factor < 1.0:
+                speed_tag = " (Slowed)"
+            elif speed_factor > 1.0:
+                speed_tag = " (Speed Up)"
+            else:
+                speed_tag = ""
+            
+            # Обновляем title в метаданных
+            original_title = metadata.get('title', '')
+            if original_title:
+                # Убираем старые теги из title, если они есть
+                title_clean = original_title.replace(" (Slowed)", "").replace(" (Speed Up)", "").strip()
+                
+                # Извлекаем только название трека, удаляя исполнителя из title
+                # Обычные форматы: "Artist - Title", "Artist: Title", "Artist | Title"
+                song_title = title_clean
+                
+                # Список всех возможных разделителей (с пробелами и без)
+                separators = [
+                    ' - ', ' – ', ' — ',  # Тире с пробелами
+                    ' : ', ': ', ' | ', ' / ',  # Другие разделители
+                    '- ', '– ', '— ',  # Тире только с пробелом справа
+                    ' -', ' –', ' —',  # Тире только с пробелом слева
+                    ':', '|', '/',  # Без пробелов
+                ]
+                
+                # Если есть отдельное поле artist, ОБЯЗАТЕЛЬНО удаляем его из title
+                artist_name = metadata.get('artist', '').strip()
+                if artist_name:
+                    # Нормализуем для сравнения (убираем лишние пробелы, приводим к нижнему регистру)
+                    artist_normalized = ' '.join(artist_name.lower().split())
+                    title_normalized = title_clean.lower()
+                    
+                    # Пытаемся найти и удалить artist в разных вариациях
+                    found_and_removed = False
+                    
+                    # Вариант 1: "Artist - Title" или "Artist: Title" и т.д.
+                    for sep in separators:
+                        sep_normalized = sep.strip()
+                        # Проверяем начало строки
+                        pattern_variants = [
+                            artist_name + sep,
+                            artist_name.lower() + sep,
+                            artist_name.upper() + sep,
+                            artist_name.title() + sep,
+                        ]
+                        
+                        for pattern in pattern_variants:
+                            if title_clean.startswith(pattern):
+                                song_title = title_clean[len(pattern):].strip()
+                                found_and_removed = True
+                                break
+                        
+                        if found_and_removed:
+                            break
+                        
+                        # Проверяем конец строки: "Title - Artist"
+                        pattern_variants = [
+                            sep + artist_name,
+                            sep + artist_name.lower(),
+                            sep + artist_name.upper(),
+                            sep + artist_name.title(),
+                        ]
+                        
+                        for pattern in pattern_variants:
+                            if title_clean.endswith(pattern):
+                                song_title = title_clean[:-len(pattern):].strip()
+                                found_and_removed = True
+                                break
+                        
+                        if found_and_removed:
+                            break
+                    
+                    # Вариант 2: Если не нашли с разделителями, ищем artist в начале без учета регистра
+                    if not found_and_removed:
+                        title_lower = title_clean.lower()
+                        artist_lower = artist_name.lower()
+                        
+                        # Проверяем, начинается ли title с artist (с разделителем или без)
+                        if title_lower.startswith(artist_lower):
+                            # Находим где заканчивается artist в оригинальном title
+                            # Ищем позицию после artist
+                            remaining_pos = len(artist_name)
+                            
+                            # Пропускаем пробелы и разделители после artist
+                            while remaining_pos < len(title_clean) and (
+                                title_clean[remaining_pos] in ' \t' or
+                                title_clean[remaining_pos:remaining_pos+2] in [' -', ' –', ' —', ' :', ' |', ' /']
+                            ):
+                                remaining_pos += 1
+                            
+                            if remaining_pos < len(title_clean):
+                                song_title = title_clean[remaining_pos:].strip()
+                                # Убираем разделители в начале, если остались
+                                while song_title and song_title[0] in '-–—:|/':
+                                    song_title = song_title[1:].strip()
+                                found_and_removed = True
+                    
+                    # Если все еще не удалили, пробуем через регулярное выражение или простое удаление
+                    if not found_and_removed or song_title == title_clean:
+                        # Последняя попытка: удаляем все до первого разделителя, если первая часть похожа на artist
+                        for sep in separators:
+                            if sep in title_clean:
+                                parts = title_clean.split(sep, 1)
+                                if len(parts) == 2:
+                                    part1, part2 = parts[0].strip(), parts[1].strip()
+                                    # Если первая часть совпадает с artist (с учетом регистра)
+                                    if part1.lower() == artist_lower:
+                                        song_title = part2
+                                        found_and_removed = True
+                                        break
+                                    # Или если первая часть короткая и вторая длинная (скорее всего artist - title)
+                                    elif len(part1) < 30 and len(part2) > len(part1):
+                                        song_title = part2
+                                        found_and_removed = True
+                                        break
+                
+                # Если не удалось извлечь через artist, пробуем общий подход
+                # Ищем первый разделитель и берем часть после него (или более длинную часть)
+                if song_title == title_clean:
+                    best_match = None
+                    best_position = -1
+                    
+                    for sep in separators:
+                        if sep in title_clean:
+                            parts = title_clean.split(sep, 1)
+                            if len(parts) == 2:
+                                part1, part2 = parts[0].strip(), parts[1].strip()
+                                # Предпочитаем более длинную часть как название трека
+                                # Но если первая часть явно короче и похожа на имя, берем вторую
+                                if len(part2) > len(part1) or len(part1) < 20:
+                                    if best_position < title_clean.index(sep):
+                                        best_match = part2
+                                        best_position = title_clean.index(sep)
+                    
+                    if best_match:
+                        song_title = best_match
+                
+                # Если есть artist в метаданных, но мы все еще не удалили его из title,
+                # применяем принудительное удаление - берем все после первого разделителя
+                if artist_name and song_title == title_clean:
+                    # Принудительно ищем первый разделитель и берем часть после него
+                    for sep in separators:
+                        if sep in title_clean:
+                            parts = title_clean.split(sep, 1)
+                            if len(parts) == 2:
+                                song_title = parts[1].strip()
+                                logger.debug(f"Принудительно извлечен title после разделителя '{sep}': {song_title}")
+                                break
+                
+                # Финальная проверка: если title все еще содержит artist (по подстроке), удаляем его
+                if artist_name and artist_name.lower() in song_title.lower() and song_title != title_clean:
+                    # Если в извлеченном title все еще есть artist, пробуем удалить
+                    parts = song_title.split(artist_name, 1)
+                    if len(parts) == 2:
+                        # Берем часть без artist
+                        remaining = (parts[0] + parts[1]).strip()
+                        # Убираем разделители в начале
+                        while remaining and remaining[0] in '-–—:|/ ':
+                            remaining = remaining[1:].strip()
+                        if remaining:
+                            song_title = remaining
+                
+                # Если все еще не изменилось, оставляем как есть
+                new_title = song_title + speed_tag
+            elif original_filename:
+                # Если нет title, но есть оригинальное имя файла, используем его
+                stem_clean = Path(original_filename).stem.replace(" (Slowed)", "").replace(" (Speed Up)", "").strip()
+                new_title = stem_clean + speed_tag
+            else:
+                # Если нет ни title, ни оригинального имени файла, не добавляем title в метаданные
+                new_title = None
+            
+            # Собираем список метаданных для добавления
+            # ВАЖНО: НЕ используем -map_metadata, чтобы старый title не копировался
+            # Это гарантирует, что в выходном файле будет только наш новый title
+            metadata_params = []
+            
+            # Явно передаем все метаданные из исходного файла, ИСКЛЮЧАЯ title
+            # Это сохраняет artist, album и другие метаданные, но НЕ title
+            for key, value in metadata.items():
+                if value:  # Пропускаем пустые значения
+                    # НЕ передаем title, так как он будет обновлен
+                    if key.lower() != 'title':
+                        # Экранируем значения метаданных для командной строки
+                        # Заменяем специальные символы, которые могут вызвать проблемы
+                        value_str = str(value).replace('\\', '\\\\').replace(':', '\\:').replace('=', '\\=')
+                        metadata_params.extend(['-metadata', f'{key}={value_str}'])
+            
+            # В конце добавляем НОВЫЙ title (это ЕДИНСТВЕННЫЙ title в файле)
+            if new_title:
+                # Экранируем title тоже
+                title_str = new_title.replace('\\', '\\\\').replace(':', '\\:').replace('=', '\\=')
+                metadata_params.extend(['-metadata', f'title={title_str}'])
+            
+            # Собираем команду ffmpeg
+            # Используем -map_metadata -1 чтобы НЕ копировать метаданные автоматически
+            # и добавляем только те, которые мы явно указали
+            cmd = [
+                'ffmpeg',
+                '-i', str(input_path),
+                '-map_metadata', '-1',  # НЕ копируем метаданные из исходного файла
+                '-af', filter_complex,
+                '-ar', str(current_sr),  # Устанавливаем sample rate вывода
+                *metadata_params,  # Добавляем только наши метаданные (без старого title)
+                *codec_params,
+                '-y',  # Перезаписывать выходной файл
+                str(output_path)
+            ]
+            
+            logger.debug(f"Выполнение команды: {' '.join(cmd)}")
+            
+            result = subprocess.run(
+                cmd,
+                stdout=subprocess.PIPE,
+                stderr=subprocess.PIPE,
+                text=True,
+                timeout=300  # Максимум 5 минут на обработку
+            )
+            
+            if result.returncode != 0:
+                logger.error(f"Ошибка ffmpeg: {result.stderr}")
+                return False
+            
+            # Проверяем, что выходной файл создан
+            if not output_path.exists() or output_path.stat().st_size == 0:
+                logger.error("Выходной файл не создан или пуст")
+                return False
+            
+            logger.info(f"Аудио успешно обработано: {output_path} ({output_path.stat().st_size / 1024:.2f} КБ)")
+            return True
+            
+        except subprocess.TimeoutExpired:
+            logger.error("Превышено время обработки файла (5 минут)")
+            return False
+        except Exception as e:
+            logger.error(f"Ошибка при обработке аудио: {e}", exc_info=True)
+            return False
+    
+    def _get_codec_params(self, extension: str) -> list:
+        """Возвращает параметры кодека для формата"""
+        extension = extension.lower()
+        
+        params_map = {
+            '.mp3': [
+                '-acodec', 'libmp3lame', 
+                '-q:a', '2',  # Качество ~192 kbps
+                '-id3v2_version', '3',  # Используем ID3v2.3 для лучшей совместимости
+                '-write_id3v2', '1',  # Включаем запись ID3v2 тегов
+            ],
+            '.m4a': ['-acodec', 'aac', '-b:a', '192k'],
+            '.ogg': ['-acodec', 'libvorbis', '-q:a', '5'],   # Качество ~160 kbps
+            '.flac': ['-acodec', 'flac', '-compression_level', '5'],
+            '.wav': ['-acodec', 'pcm_s16le'],
+            '.opus': ['-acodec', 'libopus', '-b:a', '128k'],
+            '.aac': ['-acodec', 'aac', '-b:a', '192k'],
+        }
+        
+        # Для неизвестных форматов используем MP3 как fallback
+        fallback_params = [
+            '-acodec', 'libmp3lame', 
+            '-q:a', '2',
+            '-id3v2_version', '3',
+            '-write_id3v2', '1',
+        ]
+        return params_map.get(extension, fallback_params)
+    
+    def extract_audio_from_video(self, video_path: Path, output_path: Path) -> bool:
+        """
+        Извлекает аудио из видео файла
+        
+        Args:
+            video_path: Путь к видео файлу
+            output_path: Путь для сохранения извлеченного аудио
+        
+        Returns:
+            True если успешно, False при ошибке
+        """
+        if not video_path.exists():
+            logger.error(f"Видео файл не существует: {video_path}")
+            return False
+        
+        try:
+            logger.info(f"Извлечение аудио из видео: {video_path}")
+            
+            cmd = [
+                'ffmpeg',
+                '-i', str(video_path),
+                '-vn',  # Без видео
+                '-acodec', 'pcm_s16le',  # WAV формат
+                '-ar', '44100',  # Sample rate
+                '-ac', '2',  # Стерео
+                '-y',
+                str(output_path)
+            ]
+            
+            result = subprocess.run(
+                cmd,
+                stdout=subprocess.PIPE,
+                stderr=subprocess.PIPE,
+                text=True,
+                timeout=300
+            )
+            
+            if result.returncode != 0:
+                logger.error(f"Ошибка при извлечении аудио: {result.stderr}")
+                return False
+            
+            if not output_path.exists() or output_path.stat().st_size == 0:
+                logger.error("Извлеченный аудио файл пуст или не создан")
+                return False
+            
+            logger.info(f"Аудио успешно извлечено: {output_path}")
+            return True
+            
+        except subprocess.TimeoutExpired:
+            logger.error("Превышено время извлечения аудио (5 минут)")
+            return False
+        except Exception as e:
+            logger.error(f"Ошибка при извлечении аудио: {e}", exc_info=True)
+            return False
+    
+    def get_output_filename(self, original_filename: str, speed_factor: float) -> str:
+        """
+        Генерирует имя выходного файла
+        
+        Args:
+            original_filename: Исходное имя файла
+            speed_factor: Коэффициент скорости
+        
+        Returns:
+            Новое имя файла
+        """
+        # Получаем имя и расширение
+        path = Path(original_filename)
+        stem = path.stem
+        suffix = path.suffix
+        
+        # Определяем, что добавить к названию
+        if speed_factor < 1.0:
+            speed_tag = " (Slowed)"
+        elif speed_factor > 1.0:
+            speed_tag = " (Speed Up)"
+        else:
+            speed_tag = ""
+        
+        # Убираем старые теги, если они есть
+        stem_clean = stem.replace(" (Slowed)", "").replace(" (Speed Up)", "").strip()
+        
+        # Добавляем новый тег
+        new_stem = stem_clean + speed_tag
+        
+        # Также добавляем процент для совместимости
+        speed_percent = int((speed_factor - 1.0) * 100)
+        if speed_percent != 0:
+        if speed_percent >= 0:
+                speed_str = f"_{speed_percent:+d}%"
+            else:
+                speed_str = f"_{speed_percent}%"
+        else:
+            speed_str = ""
+        
+        return f"{new_stem}{speed_str}{suffix}"
+    
+    def convert_to_mp3_for_telegram(self, input_path: Path, output_path: Path) -> bool:
+        """
+        Конвертирует аудио файл в MP3 для отправки в Telegram
+        
+        Args:
+            input_path: Путь к исходному файлу
+            output_path: Путь для сохранения MP3 файла
+        
+        Returns:
+            True если успешно, False при ошибке
+        """
+        if not input_path.exists():
+            logger.error(f"Входной файл не существует: {input_path}")
+            return False
+        
+        try:
+            logger.info(f"Конвертация в MP3: {input_path} -> {output_path}")
+            
+            # Получаем метаданные из исходного файла для сохранения
+            metadata = self._get_metadata(input_path)
+            
+            # Явно передаем все метаданные, НЕ используя -map_metadata
+            metadata_params = []
+            for key, value in metadata.items():
+                if value:  # Пропускаем пустые значения
+                    # Экранируем значения метаданных
+                    value_str = str(value).replace('\\', '\\\\').replace(':', '\\:').replace('=', '\\=')
+                    metadata_params.extend(['-metadata', f'{key}={value_str}'])
+            
+            # Собираем команду ffmpeg для конвертации в MP3
+            cmd = [
+                'ffmpeg',
+                '-i', str(input_path),
+                '-map_metadata', '-1',  # НЕ копируем метаданные автоматически
+                *metadata_params,  # Добавляем только явно указанные метаданные
+                '-acodec', 'libmp3lame',
+                '-q:a', '2',  # Качество ~192 kbps
+                '-id3v2_version', '3',
+                '-write_id3v2', '1',
+                '-y',
+                str(output_path)
+            ]
+            
+            result = subprocess.run(
+                cmd,
+                stdout=subprocess.PIPE,
+                stderr=subprocess.PIPE,
+                text=True,
+                timeout=300
+            )
+            
+            if result.returncode != 0:
+                logger.error(f"Ошибка при конвертации в MP3: {result.stderr}")
+                return False
+            
+            if not output_path.exists() or output_path.stat().st_size == 0:
+                logger.error("MP3 файл не создан или пуст")
+                return False
+            
+            logger.info(f"Файл успешно сконвертирован в MP3: {output_path}")
+            return True
+            
+        except subprocess.TimeoutExpired:
+            logger.error("Превышено время конвертации в MP3 (5 минут)")
+            return False
+        except Exception as e:
+            logger.error(f"Ошибка при конвертации в MP3: {e}", exc_info=True)
+            return False
+    
+    def is_telegram_playable_format(self, file_path: Path) -> bool:
+        """
+        Проверяет, может ли Telegram воспроизвести файл напрямую
+        
+        Args:
+            file_path: Путь к файлу
+        
+        Returns:
+            True если формат поддерживается для прямого воспроизведения
+        """
+        extension = file_path.suffix.lower()
+        # Telegram поддерживает для прямого воспроизведения: MP3, OGG, M4A
+        playable_formats = {'.mp3', '.ogg', '.m4a', '.aac'}
+        return extension in playable_formats
+