iceshrimp-legacy/src/server/api/endpoints/hashtags/trend.ts

140 lines
3.8 KiB
TypeScript
Raw Normal View History

2018-06-11 02:11:32 +02:00
import Note from '../../../../models/note';
2018-06-11 18:41:17 +02:00
/*
a分間のユニーク投稿数が今からa分前b分前の間のユニーク投稿数のn倍以上5
稿稿稿稿1
*/
2018-06-11 18:51:51 +02:00
const rangeA = 1000 * 60 * 30; // 30分
const rangeB = 1000 * 60 * 120; // 2時間
2018-06-16 08:23:03 +02:00
const coefficient = 1.25; // 「n倍」の部分
2018-06-11 19:00:05 +02:00
const requiredUsers = 3; // 最低何人がそのタグを投稿している必要があるか
2018-06-11 18:41:17 +02:00
2018-06-11 19:46:54 +02:00
const max = 5;
2018-06-11 02:11:32 +02:00
/**
* Get trends of hashtags
*/
2018-06-11 06:49:53 +02:00
module.exports = () => new Promise(async (res, rej) => {
2018-06-11 18:41:17 +02:00
//#region 1. 直近Aの内に投稿されたハッシュタグ(とユーザーのペア)を集計
2018-06-11 02:11:32 +02:00
const data = await Note.aggregate([{
$match: {
createdAt: {
2018-06-11 18:41:17 +02:00
$gt: new Date(Date.now() - rangeA)
2018-06-11 02:11:32 +02:00
},
2018-06-16 08:23:03 +02:00
tagsLower: {
2018-06-11 02:11:32 +02:00
$exists: true,
$ne: []
}
}
}, {
2018-06-16 08:23:03 +02:00
$unwind: '$tagsLower'
2018-06-11 02:11:32 +02:00
}, {
$group: {
2018-06-16 08:23:03 +02:00
_id: { tag: '$tagsLower', userId: '$userId' }
2018-06-11 02:11:32 +02:00
}
}]) as Array<{
2018-06-11 06:45:32 +02:00
_id: {
2018-06-16 08:23:03 +02:00
tag: string;
2018-06-11 06:45:32 +02:00
userId: any;
}
2018-06-11 02:11:32 +02:00
}>;
2018-06-11 18:41:17 +02:00
//#endregion
2018-06-11 02:11:32 +02:00
2018-06-11 04:24:29 +02:00
if (data.length == 0) {
return res([]);
}
2018-06-18 02:54:53 +02:00
const tags: Array<{
name: string;
count: number;
}> = [];
2018-06-11 06:45:32 +02:00
2018-06-11 18:41:17 +02:00
// カウント
2018-06-11 06:45:32 +02:00
data.map(x => x._id).forEach(x => {
2018-06-16 08:23:03 +02:00
const i = tags.findIndex(tag => tag.name == x.tag);
2018-06-11 06:45:32 +02:00
if (i != -1) {
tags[i].count++;
} else {
tags.push({
2018-06-16 08:23:03 +02:00
name: x.tag,
2018-06-11 06:45:32 +02:00
count: 1
});
}
});
2018-06-11 19:00:05 +02:00
// 最低要求投稿者数を下回るならカットする
2018-06-11 19:46:54 +02:00
const limitedTags = tags.filter(tag => tag.count >= requiredUsers);
2018-06-11 19:00:05 +02:00
2018-06-11 18:41:17 +02:00
//#region 2. 1で取得したそれぞれのタグについて、「直近a分間のユニーク投稿数が今からa分前今からb分前の間のユニーク投稿数のn倍以上」かどうかを判定する
2018-06-11 19:46:54 +02:00
const hotsPromises = limitedTags.map(async tag => {
2018-06-11 18:41:17 +02:00
const passedCount = (await Note.distinct('userId', {
2018-06-16 08:23:03 +02:00
tagsLower: tag.name,
2018-06-11 18:41:17 +02:00
createdAt: {
$lt: new Date(Date.now() - rangeA),
$gt: new Date(Date.now() - rangeB)
}
}) as any).length;
2018-06-11 19:46:54 +02:00
if (tag.count >= (passedCount * coefficient)) {
2018-06-11 18:41:17 +02:00
return tag;
} else {
return null;
}
});
//#endregion
2018-06-11 19:46:54 +02:00
// タグを人気順に並べ替え
let hots = (await Promise.all(hotsPromises))
2018-06-11 18:41:17 +02:00
.filter(x => x != null)
2018-06-11 04:27:21 +02:00
.sort((a, b) => b.count - a.count)
2018-06-11 06:45:32 +02:00
.map(tag => tag.name)
2018-06-11 19:46:54 +02:00
.slice(0, max);
//#region 3. もし上記の方法でのトレンド抽出の結果、求められているタグ数に達しなければ「ただ単に現在投稿数が多いハッシュタグ」に切り替える
if (hots.length < max) {
hots = hots.concat(tags
.filter(tag => hots.indexOf(tag.name) == -1)
.sort((a, b) => b.count - a.count)
.map(tag => tag.name)
.slice(0, max - hots.length));
}
//#endregion
2018-06-11 02:11:32 +02:00
2018-06-11 19:46:54 +02:00
//#region 2(または3)で話題と判定されたタグそれぞれについて過去の投稿数グラフを取得する
2018-06-11 06:45:32 +02:00
const countPromises: Array<Promise<any[]>> = [];
2018-06-11 02:11:32 +02:00
2018-06-11 06:45:32 +02:00
const range = 20;
2018-06-11 04:24:29 +02:00
2018-06-11 06:45:32 +02:00
// 10分
const interval = 1000 * 60 * 10;
for (let i = 0; i < range; i++) {
countPromises.push(Promise.all(hots.map(tag => Note.distinct('userId', {
2018-06-16 08:23:03 +02:00
tagsLower: tag,
2018-06-11 02:11:32 +02:00
createdAt: {
$lt: new Date(Date.now() - (interval * i)),
$gt: new Date(Date.now() - (interval * (i + 1)))
}
}))));
}
const countsLog = await Promise.all(countPromises);
2018-06-11 06:45:32 +02:00
const totalCounts: any = await Promise.all(hots.map(tag => Note.distinct('userId', {
2018-06-16 08:23:03 +02:00
tagsLower: tag,
2018-06-11 06:45:32 +02:00
createdAt: {
$gt: new Date(Date.now() - (interval * range))
}
})));
2018-06-11 18:41:17 +02:00
//#endregion
2018-06-11 06:45:32 +02:00
2018-06-11 02:11:32 +02:00
const stats = hots.map((tag, i) => ({
tag,
2018-06-11 06:45:32 +02:00
chart: countsLog.map(counts => counts[i].length),
usersCount: totalCounts[i].length
2018-06-11 02:11:32 +02:00
}));
res(stats);
});