Added parser
This commit is contained in:
@@ -7,7 +7,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<table border="0" cellpadding="0" cellspacing="0" width="100%" bgcolor="3481A6"><tbody><tr><td height="30" align="right" bgcolor="ffffff" colspan="2" background="lib/img/itf_ht/mn_top_bg.gif"><a href="?mnt=2"></a><a href="?mnt=3"></a><table border="0" cellpadding="0" cellspacing="0"><tbody><tr><td background="lib/img/itf_ht/mn_top_bg.gif" align="right" bgcolor="ffffff" colspan="1"><a href="?mn=2" class="t_on"> Расписание занятий </a></td><td background="lib/img/itf_ht/mn_top_bg_btn.gif" align="right" bgcolor="ffffff"><img src="lib/img/itf_ht/mn_top_btn_r.gif"></td><td background="lib/img/itf_ht/mn_top_bg_btn.gif" align="right" bgcolor="ffffff"><a href="?mn=3" class="t_on">Расписание преподавателей</a></td><td background="lib/img/itf_ht/mn_top_bg_btn.gif" align="right" bgcolor="ffffff"><img src="lib/img/itf_ht/mn_top_btn_l.gif"><a href="?mnt=4"></a></td><td background="lib/img/itf_ht/mn_top_bg_btn.gif" align="right" bgcolor="ffffff"><img src="lib/img/itf_ht/mn_top_btn_r.gif"></td><td background="lib/img/itf_ht/mn_top_bg_btn.gif" align="right" bgcolor="ffffff"><a href="?mn=4" class="t_on"></a><a href="https://lk.ks.psuti.ru/std">Личный кабинет студента</a></td><td background="lib/img/itf_ht/mn_top_bg_btn.gif" align="right" bgcolor="ffffff"><img src="lib/img/itf_ht/mn_top_btn_l.gif"></td></tr></tbody></table></td></tr></tbody></table><center><a href="https://lk.ks.psuti.ru/lib/doc/lk_ks_psuti_manual.pdf" target="blank" class="t_green_14"><b><u><i>Инструкция: "Доступ в личный кабинет студента"</i></u></b></a><br>
|
||||
<a href="https://disk.yandex.ru/d/ioxTvdQXkPpU5w" target="_blank"><u><i>Расписание занятий на 1 семестр 2023-2024 уч. год (версия для печати)</i></u></a><br>
|
||||
<a href="https://disk.yandex.ru/i/WyzJ4DVeq5e_Vg" target="_blank"><u><i>График учебного процесса на 2023/2024 уч. год (версия для печати)</i></u></a><br>
|
||||
</center><br>
|
||||
</center><br>
|
||||
<table border="0" cellpadding="0" cellspacing="0" width="100%" bgcolor="3481A6">
|
||||
<tbody><tr><td height="20" bgcolor="dddddd" align="center" colspan="7"><h7>Расписание занятий</h7></td></tr>
|
||||
<tr><td bgcolor="3481A6" align="center" colspan="7" background="lib/img/itf_ht/hr_b_01.gif"><img src="lib/img/itf_ht/hr_b_01.gif"></td></tr><tr><td height="10" bgcolor="ffffff" colspan="7" align="center">с 25.09.2023 по 01.10.2023
|
||||
@@ -28,7 +28,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b>Задание для выполнения</b></td>
|
||||
</tr>
|
||||
<tr align="center"><td bgcolor="ffffff">1</td>
|
||||
<td bgcolor="ffffff">08:00 – 09:30
|
||||
<td bgcolor="ffffff">08:00 – 09:30
|
||||
</td>
|
||||
<td bgcolor="ffffff">Самостоятельная работа</td>
|
||||
<td bgcolor="ffffff">Физика<br>Кусаева Зарина Владимировна<font class="t_ur2"><br>Л. Толстого, 23<br>Кабинет: 410-2</font></td>
|
||||
@@ -36,7 +36,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b><a href="https://cloud.mail.ru/public/eDk2/eV51SaUoU" target="blank">Лекция Задачи</a></b><br></td>
|
||||
<td bgcolor="ffffff">Сделать конспект по теме: выписать определения, формулы. Самостоятельно решить задачи.<br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">2</td>
|
||||
<td bgcolor="ffffff">09:40 – 11:10
|
||||
<td bgcolor="ffffff">09:40 – 11:10
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Математика<br>Амукова Светлана Николаевна<font class="t_ur2"><br>Л. Толстого, 23<br>Кабинет: 410-2</font></td>
|
||||
@@ -44,7 +44,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">3</td>
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Математика<br>Амукова Светлана Николаевна<font class="t_ur2"><br>Л. Толстого, 23<br>Кабинет: 410-2</font></td>
|
||||
@@ -52,7 +52,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">4</td>
|
||||
<td bgcolor="ffffff">13:20 – 14:50
|
||||
<td bgcolor="ffffff">13:20 – 14:50
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Химия<br>Тарасова Таисия Евгеньевна<font class="t_ur2"><br>Л. Толстого, 23<br>Кабинет: 410-2</font></td>
|
||||
@@ -71,7 +71,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b>Задание для выполнения</b></td>
|
||||
</tr>
|
||||
<tr align="center"><td bgcolor="ffffff">3</td>
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">История<br>Арефьев Андрей Андреевич<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 401</font></td>
|
||||
@@ -79,7 +79,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffbb">4</td>
|
||||
<td bgcolor="ffffbb">13:20 – 14:50
|
||||
<td bgcolor="ffffbb">13:20 – 14:50
|
||||
<br><a class="t_zm">дистанционно</a></td>
|
||||
<td bgcolor="ffffbb"></td>
|
||||
<td bgcolor="ffffbb">Физическая культура<br> </td>
|
||||
@@ -87,7 +87,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffbb"></td>
|
||||
<td bgcolor="ffffbb"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">5</td>
|
||||
<td bgcolor="ffffff">15:10 – 16:40
|
||||
<td bgcolor="ffffff">15:10 – 16:40
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Информатика<br>Ларионова Софья Николаевна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 208</font></td>
|
||||
@@ -106,7 +106,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b>Задание для выполнения</b></td>
|
||||
</tr>
|
||||
<tr align="center"><td bgcolor="ffffff">3</td>
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Физика<br>Кусаева Зарина Владимировна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 310</font></td>
|
||||
@@ -114,7 +114,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Проверка конспекта и задач<br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffbb">4</td>
|
||||
<td bgcolor="ffffbb">13:20 – 14:50
|
||||
<td bgcolor="ffffbb">13:20 – 14:50
|
||||
<br><a class="t_zm">перенос с 02.10.23</a></td>
|
||||
<td bgcolor="ffffbb"></td>
|
||||
<td bgcolor="ffffbb">Физика<br>Кусаева Зарина Владимировна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 310</font></td>
|
||||
@@ -122,7 +122,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffbb"></td>
|
||||
<td bgcolor="ffffbb"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">5</td>
|
||||
<td bgcolor="ffffff">15:10 – 16:40
|
||||
<td bgcolor="ffffff">15:10 – 16:40
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Иностранный язык<br>Карпеева Александра Сергеевна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 234</font></td>
|
||||
@@ -130,7 +130,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffbb">6</td>
|
||||
<td bgcolor="ffffbb">16:50 – 18:20
|
||||
<td bgcolor="ffffbb">16:50 – 18:20
|
||||
<br><a class="t_zm">дистанционно</a></td>
|
||||
<td bgcolor="ffffbb"></td>
|
||||
<td bgcolor="ffffbb">География<br> </td>
|
||||
@@ -149,7 +149,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b>Задание для выполнения</b></td>
|
||||
</tr>
|
||||
<tr align="center"><td bgcolor="ffffbb">2</td>
|
||||
<td bgcolor="ffffbb">09:40 – 11:10
|
||||
<td bgcolor="ffffbb">09:40 – 11:10
|
||||
<br><a class="t_zm">дистанционно</a></td>
|
||||
<td bgcolor="ffffbb"></td>
|
||||
<td bgcolor="ffffbb">География<br> </td>
|
||||
@@ -157,7 +157,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffbb"></td>
|
||||
<td bgcolor="ffffbb"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">3</td>
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Математика<br>Амукова Светлана Николаевна<font class="t_ur2"><br>Л. Толстого, 23<br>Кабинет: 410-2</font></td>
|
||||
@@ -165,7 +165,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">4</td>
|
||||
<td bgcolor="ffffff">13:20 – 14:50
|
||||
<td bgcolor="ffffff">13:20 – 14:50
|
||||
</td>
|
||||
<td bgcolor="ffffff">Очно</td>
|
||||
<td bgcolor="ffffff">Русский язык<br>Назарова Елена Федоровна<font class="t_ur2"><br>Л. Толстого, 23<br>Кабинет: 410-2</font></td>
|
||||
@@ -173,7 +173,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b><a href="https://cloud.mail.ru/public/7mwL/Ui6a7ftsP" target="blank">Практическая работа 2</a></b><br></td>
|
||||
<td bgcolor="ffffff"><br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">5</td>
|
||||
<td bgcolor="ffffff">15:10 – 16:40
|
||||
<td bgcolor="ffffff">15:10 – 16:40
|
||||
</td>
|
||||
<td bgcolor="ffffff">Очно</td>
|
||||
<td bgcolor="ffffff">Литература<br>Назарова Елена Федоровна<font class="t_ur2"><br>Л. Толстого, 23<br>Кабинет: 410-2</font></td>
|
||||
@@ -192,7 +192,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b>Задание для выполнения</b></td>
|
||||
</tr>
|
||||
<tr align="center"><td bgcolor="ffffff">2</td>
|
||||
<td bgcolor="ffffff">09:40 – 11:10
|
||||
<td bgcolor="ffffff">09:40 – 11:10
|
||||
</td>
|
||||
<td bgcolor="ffffff">Очно</td>
|
||||
<td bgcolor="ffffff">Русский язык<br>Назарова Елена Федоровна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 324</font></td>
|
||||
@@ -200,7 +200,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b><a href="https://cloud.mail.ru/public/EBc5/MYaGgXqKe" target="blank">презентация</a></b><br></td>
|
||||
<td bgcolor="ffffff">изучить презентацию, выучить определения<br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">3</td>
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
<td bgcolor="ffffff">11:40 – 13:10
|
||||
</td>
|
||||
<td bgcolor="ffffff">Очно</td>
|
||||
<td bgcolor="ffffff">Литература<br>Назарова Елена Федоровна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 321</font></td>
|
||||
@@ -219,7 +219,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"><b>Задание для выполнения</b></td>
|
||||
</tr>
|
||||
<tr align="center"><td bgcolor="ffffff">1</td>
|
||||
<td bgcolor="ffffff">08:00 – 09:30
|
||||
<td bgcolor="ffffff">08:00 – 09:30
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">Основы безопасности жизнедеятельности<br>Корнилова Светлана Александровна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 110</font></td>
|
||||
@@ -227,7 +227,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">оформить отчет<br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">2</td>
|
||||
<td bgcolor="ffffff">09:40 – 11:10
|
||||
<td bgcolor="ffffff">09:40 – 11:10
|
||||
</td>
|
||||
<td bgcolor="ffffff">Очно</td>
|
||||
<td bgcolor="ffffff">Литература<br>Назарова Елена Федоровна<font class="t_green_10"><br>Московское шоссе, 120<br>Кабинет: 321</font></td>
|
||||
@@ -235,7 +235,7 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff">читать роман "Отцы и дети"<br></td></tr>
|
||||
<tr align="center"><td bgcolor="ffffff">3</td>
|
||||
<td bgcolor="ffffff">11:30 – 13:00
|
||||
<td bgcolor="ffffff">11:30 – 13:00
|
||||
</td>
|
||||
<td bgcolor="ffffff"></td>
|
||||
<td bgcolor="ffffff"><i>Свободное время</i><br> </td>
|
||||
@@ -357,5 +357,4 @@ export const content = `<html><head><title>Расписание занятий</
|
||||
</tbody></table></td></tr><tr><td align="right" colspan="8" background="lib/img/itf_ht/hr_b_04.gif"><img src="lib/img/itf_ht/hr_b_05.gif"></td></tr></tbody></table></td>
|
||||
</tr>
|
||||
</tbody></table><br>
|
||||
|
||||
</body></html>`
|
||||
@@ -1,18 +1,24 @@
|
||||
import { Day } from '@/shared/model/day'
|
||||
import { parsePage } from '@/app/parser/schedule'
|
||||
import contentTypeParser from 'content-type'
|
||||
import { parse } from 'node-html-parser'
|
||||
// import { parse } from 'node-html-parser'
|
||||
import { JSDOM } from 'jsdom'
|
||||
import { content as mockContent } from './mock'
|
||||
|
||||
// ПС-7: 146
|
||||
export async function getSchedule(groupID: number): Promise<Day[]> {
|
||||
// const page = await fetch(`https://lk.ks.psuti.ru/?mn=2&obj=${groupID}`)
|
||||
// const page = await fetch(`${process.env.PROXY_URL ?? 'https://lk.ks.psuti.ru'}/?mn=2&obj=${groupID}`)
|
||||
const page = { text: async () => mockContent, status: 200, headers: { get: (s: string) => s && 'text/html' } }
|
||||
const content = await page.text()
|
||||
const contentType = page.headers.get('content-type')
|
||||
if (page.status === 200 && contentType && contentTypeParser.parse(contentType).type === 'text/html') {
|
||||
const root = parse(content)
|
||||
return parsePage(root)
|
||||
try {
|
||||
const root = new JSDOM(content).window.document
|
||||
return parsePage(root)
|
||||
} catch(e) {
|
||||
console.error('Error while parsing lk.ks.psuti.ru')
|
||||
throw e
|
||||
}
|
||||
} else {
|
||||
console.error(page.status, contentType)
|
||||
console.error(content.length > 500 ? content.slice(0, 500 - 3) + '...' : content)
|
||||
|
||||
@@ -1,6 +1,5 @@
|
||||
import { Day } from '@/shared/model/day'
|
||||
import { Lesson } from '@/shared/model/lesson'
|
||||
import { HTMLElement } from 'node-html-parser'
|
||||
|
||||
const dayTitleParser = (text: string) => {
|
||||
const [dateString, week] = text.trim().split(' / ')
|
||||
@@ -10,55 +9,69 @@ const dayTitleParser = (text: string) => {
|
||||
return { date, weekNumber }
|
||||
}
|
||||
|
||||
const parseLesson = (row: HTMLElement): Lesson => {
|
||||
const cells = row.querySelectorAll(':scope > td')
|
||||
const parseLesson = (row: Element): Lesson | null => {
|
||||
const cells = Array.from(row.querySelectorAll(':scope > td'))
|
||||
if (cells[3].textContent!.trim() === 'Свободное время') return null
|
||||
|
||||
const isChange = cells.every(td => td.getAttribute('bgcolor') === 'ffffbb')
|
||||
|
||||
const timeCell = cells[1].childNodes
|
||||
const [startTime, endTime] = timeCell[0].textContent.trim().split(' – ')
|
||||
const [startTime, endTime] = timeCell[0].textContent!.trim().split(' – ')
|
||||
const time: Lesson['time'] = {
|
||||
start: startTime,
|
||||
end: endTime
|
||||
start: startTime ?? '',
|
||||
end: endTime ?? ''
|
||||
}
|
||||
if (timeCell[2]) {
|
||||
time.hint = timeCell[2].textContent.trim()
|
||||
time.hint = timeCell[2].textContent!.trim()
|
||||
}
|
||||
|
||||
const subject = ''
|
||||
const teacher = ''
|
||||
const subject = cells[3].childNodes[0].textContent!.trim()
|
||||
|
||||
const place: Lesson['place'] = {
|
||||
address: '1',
|
||||
classroom: 1
|
||||
let teacher: Lesson['teacher']
|
||||
const teacherCell = cells[3].childNodes[2]
|
||||
if (teacherCell) {
|
||||
teacher = teacherCell.textContent!.trim()
|
||||
}
|
||||
|
||||
const topic = cells[4].textContent.trim()
|
||||
const placeCell = cells[3].childNodes[3]
|
||||
|
||||
let place: Lesson['place']
|
||||
if (placeCell) {
|
||||
place = {
|
||||
address: placeCell.childNodes[1].textContent!.trim(),
|
||||
classroom: Number(placeCell.childNodes[3].textContent!.trim().match(/^Кабинет: (\d+)(-2)?$/)![1])
|
||||
}
|
||||
}
|
||||
|
||||
const topic: Lesson['topic'] = cells[4].textContent!.trim()
|
||||
|
||||
const resources: Lesson['resources'] = []
|
||||
// {
|
||||
// type: 'link'
|
||||
// title: string
|
||||
// url: string
|
||||
// } []
|
||||
Array.from(cells[5].querySelectorAll('a'))
|
||||
.forEach(a => {
|
||||
resources.push({
|
||||
type: 'link',
|
||||
title: a.textContent!.trim(),
|
||||
url: a.getAttribute('href')!
|
||||
})
|
||||
})
|
||||
|
||||
return {
|
||||
isChange,
|
||||
time,
|
||||
type: cells[2].textContent.trim(),
|
||||
type: cells[2].textContent!.trim(),
|
||||
subject,
|
||||
teacher,
|
||||
place,
|
||||
...(teacher && { teacher }),
|
||||
...(place && { place }),
|
||||
...(topic && { topic }),
|
||||
resources,
|
||||
homework: cells[6].textContent.trim()
|
||||
homework: cells[6].textContent!.trim()
|
||||
}
|
||||
}
|
||||
|
||||
export function parsePage(document: HTMLElement): Day[] {
|
||||
export function parsePage(document: Document): Day[] {
|
||||
const tables = Array.from(document.querySelectorAll('body > table'))
|
||||
const table = tables.find(table => table.querySelector(':scope > tbody > tr:first-child')?.textContent?.trim() === 'ПС-7')
|
||||
const rows = Array.from(table!.querySelectorAll(':scope > tbody > tr')).slice(1)
|
||||
const rows = Array.from(table!.children[0].children).filter(el => el.tagName === 'TR').slice(2)
|
||||
|
||||
const days = []
|
||||
// eslint-disable-next-line @typescript-eslint/ban-ts-comment
|
||||
@@ -89,7 +102,9 @@ export function parsePage(document: HTMLElement): Day[] {
|
||||
dayInfo.weekNumber = weekNumber
|
||||
previousRowIsDayTitle = true
|
||||
} else {
|
||||
dayLessons.push(parseLesson(row))
|
||||
const lesson = parseLesson(row)
|
||||
if(lesson !== null)
|
||||
dayLessons.push(lesson)
|
||||
}
|
||||
}
|
||||
|
||||
|
||||
Reference in New Issue
Block a user