十二大数据集 · 陕文投多模态资产看板
截至2026年Q2
总数据规模
104.7
TB
数据总条数
35,682
万条
总装盘数
13
图表视图
详细数据
现有数据量比例 & 语料构成
图片语料
视频语料
图片语料
71.2 TB
(68%)
视频语料
33.5 TB
(32%)
语料构成占比
图片 68% / 视频 32%
近一个季度数据获取趋势
图片语料增量
视频语料增量
数据集名称
图片语料量
(万条)
视频语料量
(万条)
文本语料量
(万条)
音频语料量
(万条)
三维模型语料量
(万条)
1. 古都大遗址数据集
2,180
860
持续获取中
持续获取中
持续获取中
2. 文化遗存精粹数据集
1,950
720
持续获取中
持续获取中
持续获取中
3. 文博数据集
2,650
1,050
持续获取中
持续获取中
持续获取中
4. 重要历史人物数据集
1,420
540
持续获取中
持续获取中
持续获取中
5. 文化典籍数据集
980
310
持续获取中
持续获取中
持续获取中
6. 红色文化数据集
1,870
1,220
持续获取中
持续获取中
持续获取中
7. 丝路非遗数据集
1,620
980
持续获取中
持续获取中
持续获取中
8. 文化艺术数据集
2,340
1,470
持续获取中
持续获取中
持续获取中
9. 文化影视和短剧数据集
1,260
2,860
持续获取中
持续获取中
持续获取中
10. 旅游资源数据集
3,120
1,350
持续获取中
持续获取中
持续获取中
11. 游客服务数据集
1,050
420
持续获取中
持续获取中
持续获取中
12. 文化和旅游公共服务配套数据集
1,380
630
持续获取中
持续获取中
持续获取中