fix(security): update dependencies to avoid RCE and other exploits

Обновлены зависимости Node.js, которые были уязвимы с разной степенью критичности.
Обновлен Next.js, так как его предыдущая используемая версия привнесла в production-среду постоянную борьбу с майнерами.
К сожалению, в этом коммите парсер расписания сломан.
This commit is contained in:
kilyabin
2026-02-11 02:45:44 +04:00
parent 47b8bc7dad
commit b9ae52681e
13 changed files with 607 additions and 1354 deletions

View File

@@ -2,7 +2,7 @@ import { Day } from '@/shared/model/day'
import { parsePage, ParseResult, WeekInfo } from '@/app/parser/schedule'
import contentTypeParser from 'content-type'
import { JSDOM } from 'jsdom'
import { reportParserError, logErrorToFile } from '@/app/logger'
import { reportParserError, logErrorToFile, logInfo } from '@/app/logger'
import { PROXY_URL } from '@/shared/constants/urls'
export type ScheduleResult = {
@@ -29,11 +29,12 @@ export async function getSchedule(groupID: number, groupName: string, wk?: numbe
}
const url = `${PROXY_URL}/?mn=2&obj=${groupID}${wk ? `&wk=${wk}` : ''}`
logInfo('Schedule fetch start', { groupID, groupName, wk: wk ?? 'current' })
// Добавляем таймаут 8 секунд для fetch запроса
const controller = new AbortController()
const timeoutId = setTimeout(() => controller.abort(), 8000) // 8 секунд
try {
const page = await fetch(url, { signal: controller.signal })
clearTimeout(timeoutId)
@@ -50,6 +51,7 @@ export async function getSchedule(groupID: number, groupName: string, wk?: numbe
currentWk: result.currentWk || wk,
availableWeeks: result.availableWeeks
}
logInfo('Schedule fetch success', { groupName, daysCount: result.days.length, currentWk: result.currentWk })
// Явно очищаем JSDOM для освобождения памяти
dom.window.close()
dom = null
@@ -177,11 +179,12 @@ export async function getTeacherSchedule(teacherID: number, teacherName: string,
}
const url = `${PROXY_URL}/?mn=3&obj=${teacherID}${wk ? `&wk=${wk}` : ''}`
logInfo('Teacher schedule fetch start', { teacherID, teacherName, wk: wk ?? 'current' })
// Добавляем таймаут 8 секунд для fetch запроса
const controller = new AbortController()
const timeoutId = setTimeout(() => controller.abort(), 8000) // 8 секунд
try {
const page = await fetch(url, { signal: controller.signal })
clearTimeout(timeoutId)
@@ -198,6 +201,7 @@ export async function getTeacherSchedule(teacherID: number, teacherName: string,
currentWk: result.currentWk || wk,
availableWeeks: result.availableWeeks
}
logInfo('Teacher schedule fetch success', { teacherName, daysCount: result.days.length, currentWk: result.currentWk })
// Явно очищаем JSDOM для освобождения памяти
dom.window.close()
dom = null

View File

@@ -1,22 +1,75 @@
import TelegramBot from 'node-telegram-bot-api'
import fs from 'fs'
import path from 'path'
const token = process.env.PARSING_FAILURE_NOTIFICATIONS_TELEGRAM_BOTAPI_TOKEN
const ownerID = process.env.PARSING_FAILURE_NOTIFICATIONS_TELEGRAM_CHAT_ID
let bot: TelegramBot
if (!token || !ownerID) {
console.warn('Telegram Token is not specified. This means you won\'t get any notifications about parsing failures.')
} else {
bot = new TelegramBot(token, { polling: false })
}
// Путь к файлу логов (в корне проекта)
const getErrorLogPath = () => {
// В production (standalone) используем текущую рабочую директорию
// В development используем корень проекта (process.cwd())
return path.join(process.cwd(), 'error.log')
async function sendTelegramMessage(text: string): Promise<void> {
if (!token || !ownerID) return
const url = `https://api.telegram.org/bot${encodeURIComponent(token)}/sendMessage`
const res = await fetch(url, {
method: 'POST',
headers: { 'Content-Type': 'application/json' },
body: JSON.stringify({ chat_id: ownerID, text }),
})
if (!res.ok) {
console.error('Telegram sendMessage failed:', res.status, await res.text())
}
}
// Уровни логов: debug < info < warn < error
const LOG_LEVELS = { debug: 0, info: 1, warn: 2, error: 3 } as const
type LogLevel = keyof typeof LOG_LEVELS
const currentLevel = ((): number => {
const env = process.env.LOG_LEVEL?.toLowerCase()
if (env && env in LOG_LEVELS) return LOG_LEVELS[env as LogLevel]
return process.env.NODE_ENV === 'development' ? LOG_LEVELS.debug : LOG_LEVELS.info
})()
const isDev = process.env.NODE_ENV === 'development'
// Путь к файлам логов (в корне проекта)
const getErrorLogPath = () => path.join(process.cwd(), 'error.log')
const getAppLogPath = () => path.join(process.cwd(), 'app.log')
function writeAppLog(level: LogLevel, message: string, data?: Record<string, unknown>): void {
if (LOG_LEVELS[level] < currentLevel) return
try {
const logPath = getAppLogPath()
const timestamp = new Date().toISOString()
let line = `[${timestamp}] ${level.toUpperCase()}: ${message}`
if (data != null && Object.keys(data).length > 0) {
line += ' ' + JSON.stringify(data)
}
line += '\n'
fs.appendFileSync(logPath, line, 'utf8')
} catch {
// не падаем из-за логгера
}
if (isDev && (level === 'debug' || level === 'info')) {
const out = level === 'debug' ? console.debug : console.info
out(`[${level}]`, message, data ?? '')
}
}
/** Логирование отладочных сообщений (пишется при LOG_LEVEL=debug или в development) */
export function logDebug(message: string, data?: Record<string, unknown>): void {
writeAppLog('debug', message, data)
}
/** Информационное логирование (пишется при LOG_LEVEL=info и выше, по умолчанию в production) */
export function logInfo(message: string, data?: Record<string, unknown>): void {
writeAppLog('info', message, data)
}
/** Предупреждения (всегда пишется в app.log при уровне warn и выше) */
export function logWarn(message: string, data?: Record<string, unknown>): void {
writeAppLog('warn', message, data)
}
/**
@@ -31,19 +84,19 @@ export function logErrorToFile(error: Error | string, context?: Record<string, u
const errorMessage = error instanceof Error ? error.message : error
const errorStack = error instanceof Error ? error.stack : undefined
const errorName = error instanceof Error ? error.name : 'Error'
let logEntry = `[${timestamp}] ${errorName}: ${errorMessage}\n`
if (errorStack) {
logEntry += `Stack: ${errorStack}\n`
}
if (context && Object.keys(context).length > 0) {
logEntry += `Context: ${JSON.stringify(context, null, 2)}\n`
}
logEntry += '---\n'
// Используем appendFileSync для надежности (не блокирует надолго)
fs.appendFileSync(logPath, logEntry, 'utf8')
} catch (logError) {
@@ -53,7 +106,5 @@ export function logErrorToFile(error: Error | string, context?: Record<string, u
}
export async function reportParserError(...text: string[]) {
if (!token || !ownerID) return
await bot.sendMessage(ownerID, text.join(' '))
}
await sendTelegramMessage(text.join(' '))
}

View File

@@ -1,5 +1,6 @@
import { Day } from '@/shared/model/day'
import { Lesson } from '@/shared/model/lesson'
import { logDebug } from '@/app/logger'
export type WeekInfo = {
wk: number
@@ -770,19 +771,18 @@ export function parsePage(document: Document, groupName: string, url?: string, s
}
if (!table) {
// Логируем информацию о найденных таблицах для отладки
console.log(`[parsePage] Found ${tables.length} tables, analyzing...`)
logDebug('parsePage: tables analyzing', { groupName, tablesCount: tables.length })
tables.forEach((t, i) => {
const text = t.textContent?.substring(0, 200) || ''
const hasDayTitles = /(Понедельник|Вторник|Среда|Четверг|Пятница|Суббота|Воскресенье)\s+\d{1,2}\.\d{1,2}\.\d{4}/i.test(text)
const hasTimeSlots = /\d{1,2}:\d{2}\s*\s*\d{1,2}:\d{2}/.test(text)
const nameCount = (text.match(/[А-ЯЁ][а-яё]+\s+[А-ЯЁ][а-яё]+\s+[А-ЯЁ][а-яё]+/g) || []).length
console.log(`[parsePage] Table ${i}: rows=${t.querySelectorAll('tr').length}, hasDayTitles=${hasDayTitles}, hasTimeSlots=${hasTimeSlots}, nameCount=${nameCount}, preview="${text}"`)
logDebug('parsePage: table analysis', { tableIndex: i, rows: t.querySelectorAll('tr').length, hasDayTitles, hasTimeSlots, nameCount, preview: text.substring(0, 80) })
})
throw new Error(`Table not found for ${groupName}. Found ${tables.length} tables on the page.`)
}
console.log(`[parsePage] Selected table with ${table.querySelectorAll('tr').length} rows`)
logDebug('parsePage: selected table', { groupName, rows: table.querySelectorAll('tr').length })
// Пытаемся найти tbody или использовать прямые children таблицы
let tbody: HTMLTableSectionElement | null = null
@@ -799,15 +799,19 @@ export function parsePage(document: Document, groupName: string, url?: string, s
}
}
// Получаем строки из tbody или напрямую из таблицы
// Структура таблицы расписания с lk.ks.psuti.ru (mn=2&obj=ID группы):
// allRows[0] — название группы в одной ячейке (colspan=7);
// allRows[1] — пустая строка-разделитель (одна td colspan=7);
// далее повторяются блоки: [заголовок дня] [заголовок колонок] [пары...] [пустая строка].
// Заголовок дня: одна <tr> с одной <td colspan=7>, внутри вложенная таблица с <h3>Понедельник DD.MM.YYYY / N неделя</h3>.
// Заголовок колонок: <tr> с 7 <td> — «№ пары», «Время занятий», «Способ», «Дисциплина, преподаватель», «Тема занятия», «Ресурс», «Задание для выполнения».
// Строка пары: 7 <td> — номер, время (08:00 09:30), способ, ячейка с предметом/преподавателем/местом (subject + <br> + teacher + <font> адрес, Кабинет), тема, ресурсы, задание.
const allRows = tbody
? Array.from(tbody.querySelectorAll('tr'))
: Array.from(table.querySelectorAll('tr'))
const rows = allRows.slice(2)
console.log(`[parsePage] Found ${rows.length} rows to parse for ${groupName}`)
console.log(`[parsePage] First few rows text:`, rows.slice(0, 5).map(r => r.textContent?.trim().substring(0, 50)))
logDebug('parsePage: rows to parse', { groupName, rowsCount: rows.length, firstRows: rows.slice(0, 5).map(r => r.textContent?.trim().substring(0, 50)) })
const days = []
// eslint-disable-next-line @typescript-eslint/ban-ts-comment
@@ -827,13 +831,13 @@ export function parsePage(document: Document, groupName: string, url?: string, s
const rowText = row.textContent?.trim() || ''
const isDivider = rowText === ''
// Строка заголовка таблицы (идёт сразу после заголовка дня) — не считать новым днём
const looksLikeTableHeader = /№ пары|Время занятий|Дисциплина, преподаватель/i.test(rowText)
// Проверяем, является ли строка заголовком дня: должна содержать паттерн "день недели дата / номер неделя"
// Поддерживаем оба формата: с пробелом и без пробела перед "/"
const looksLikeDayTitle = /(Понедельник|Вторник|Среда|Четверг|Пятница|Суббота|Воскресенье)\s+\d{1,2}\.\d{1,2}\.\d{4}\s*\/\s*\d+\s+неделя/i.test(rowText)
// Заголовок дня может быть в любой момент - либо когда нет дня, либо когда начинается новый день
const isDayTitle = looksLikeDayTitle
const isDayTitle = looksLikeDayTitle && !looksLikeTableHeader
// Если уже есть день с датой и встречаем новый заголовок дня, сохраняем предыдущий день
const isNewDayTitle = looksLikeDayTitle && ('date' in dayInfo)
const isNewDayTitle = isDayTitle && ('date' in dayInfo)
const isTableHeader = previousRowIsDayTitle
// Если встречаем новый день, сохраняем предыдущий
@@ -847,8 +851,9 @@ export function parsePage(document: Document, groupName: string, url?: string, s
}
if (isDivider) {
// Сохраняем день при разделителе, только если есть данные
if ('date' in dayInfo) {
// Сохраняем день при разделителе только если есть уроки — иначе пустая строка
// между заголовком дня и строкой «№ пары / Время» сбрасывала контекст и все пары пропускались
if ('date' in dayInfo && dayLessons.length > 0) {
days.push({ ...dayInfo, lessons: dayLessons })
dayLessons = []
// eslint-disable-next-line @typescript-eslint/ban-ts-comment
@@ -880,7 +885,7 @@ export function parsePage(document: Document, groupName: string, url?: string, s
try {
const { date, weekNumber } = dayTitleParser(dayTitleText)
console.log(`[parsePage] Parsed day title: ${dayTitleText} -> date: ${date}, week: ${weekNumber}`)
logDebug('parsePage: parsed day title', { dayTitleText, date, weekNumber })
dayInfo.date = date
dayInfo.weekNumber = weekNumber
if (!currentWeekNumber) {
@@ -890,16 +895,21 @@ export function parsePage(document: Document, groupName: string, url?: string, s
// Важно: после парсинга заголовка дня, следующий цикл должен обрабатывать уроки
// Поэтому НЕ делаем continue, а просто устанавливаем флаг
// Проверяем, что dayInfo действительно установлен
console.log(`[parsePage] Day info set: date=${dayInfo.date}, weekNumber=${dayInfo.weekNumber}`)
logDebug('parsePage: day info set', { date: dayInfo.date, weekNumber: dayInfo.weekNumber })
} catch (error) {
// Если не удалось распарсить заголовок, пропускаем строку
console.warn(`[parsePage] Failed to parse day title: ${dayTitleText}`, error)
logDebug('parsePage: failed to parse day title', { dayTitleText, error: String(error) })
continue
}
} else {
// Пытаемся распарсить как урок, только если уже есть день
const hasDayContext = 'date' in dayInfo
if (hasDayContext) {
// Сразу пропускаем строку заголовка таблицы (№ пары, Время занятий, …)
if (looksLikeTableHeader) {
previousRowIsDayTitle = false
continue
}
// Пропускаем строки, которые являются только номерами пар или временем (заголовки столбцов)
const cells = Array.from(row.querySelectorAll(':scope > td'))
const cellTexts = cells.map(cell => cell.textContent?.trim() || '').filter(t => t)
@@ -928,11 +938,11 @@ export function parsePage(document: Document, groupName: string, url?: string, s
} else if ('fallbackDiscipline' in lesson && lesson.fallbackDiscipline) {
lessonName = lesson.fallbackDiscipline
}
console.log(`[parsePage] Parsed lesson: ${lessonName}`)
logDebug('parsePage: parsed lesson', { lessonName })
dayLessons.push(lesson)
} else {
// Логируем строки, которые не распарсились как уроки
console.log(`[parsePage] Failed to parse lesson from row: ${rowText.substring(0, 100)}`)
logDebug('parsePage: failed to parse lesson from row', { rowPreview: rowText.substring(0, 100) })
}
} else {
// Логируем строки, которые не распознаются как дни и не парсятся как уроки
@@ -940,7 +950,7 @@ export function parsePage(document: Document, groupName: string, url?: string, s
if (rowText && !looksLikeDayTitle) {
const cells = Array.from(row.querySelectorAll(':scope > td'))
if (cells.length > 0) {
console.log(`[parsePage] Skipping row (no day context): ${rowText.substring(0, 100)}`)
logDebug('parsePage: skipping row (no day context)', { rowPreview: rowText.substring(0, 100) })
}
}
}
@@ -949,11 +959,11 @@ export function parsePage(document: Document, groupName: string, url?: string, s
// Добавляем последний день, если он не был добавлен
if ('date' in dayInfo) {
console.log(`[parsePage] Adding final day with ${dayLessons.length} lessons`)
logDebug('parsePage: adding final day', { lessonsCount: dayLessons.length })
days.push({ ...dayInfo, lessons: dayLessons })
}
console.log(`[parsePage] Total days parsed: ${days.length}`)
logDebug('parsePage: total days parsed', { daysCount: days.length })
// Парсим навигацию по неделям только если включена навигация
let availableWeeks: WeekInfo[] | undefined