feat: 大文件合并和导入性能优化

2026-05-27 01:01:51 +08:00 · 2025-12-02 01:53:44 +08:00
parent b43191c7e0
commit 7ca4d0d7d8
7 changed files with 1247 additions and 137 deletions
@@ -1,6 +1,7 @@
 import { ipcMain, app, dialog, clipboard, shell, BrowserWindow } from 'electron'
 import { autoUpdater } from 'electron-updater'
 import * as fs from 'fs/promises'
+import * as fsSync from 'fs'

 // 导入数据库核心模块（用于导入和删除操作）
 import * as databaseCore from './database/core'
@@ -8,36 +9,47 @@ import * as databaseCore from './database/core'
 import * as worker from './worker'
 // 导入解析器模块
 import * as parser from './parser'
-import { detectFormat, type ParseProgress, type ParseResult } from './parser'
+import { detectFormat, type ParseProgress } from './parser'
 // 导入合并模块
 import * as merger from './merger'
+import { deleteTempDatabase, cleanupAllTempDatabases } from './merger/tempCache'
 import type { MergeParams } from '../../src/types/chat'

 console.log('[IpcMain] Database, Worker and Parser modules imported')

-// ==================== 解析结果缓存 ====================
-// 用于合并功能：缓存文件的完整解析结果，避免重复解析
-// 这样用户删除本地文件后仍然可以进行合并
-const parseResultCache = new Map<string, ParseResult>()
+// ==================== 临时数据库缓存 ====================
+// 用于合并功能：缓存文件对应的临时数据库路径
+// 这样用户删除本地文件后仍然可以进行合并（数据已存入临时数据库）
+const tempDbCache = new Map<string, string>()

 /**
- * 清理指定文件的缓存
+ * 清理指定文件的缓存（删除临时数据库）
 */
-function clearParseCache(filePath: string): void {
-  parseResultCache.delete(filePath)
+function clearTempDbCache(filePath: string): void {
+  const tempDbPath = tempDbCache.get(filePath)
+  if (tempDbPath) {
+    deleteTempDatabase(tempDbPath)
+    tempDbCache.delete(filePath)
+  }
 }

 /**
- * 清理所有缓存
+ * 清理所有缓存（删除所有临时数据库）
 */
-function clearAllParseCache(): void {
-  parseResultCache.clear()
-  console.log('[IpcMain] 已清理所有解析缓存')
+function clearAllTempDbCache(): void {
+  for (const tempDbPath of tempDbCache.values()) {
+    deleteTempDatabase(tempDbPath)
+  }
+  tempDbCache.clear()
+  console.log('[IpcMain] 已清理所有临时数据库缓存')
 }

 const mainIpcMain = (win: BrowserWindow) => {
  console.log('[IpcMain] Registering IPC handlers...')

+  // 清理残留的临时数据库（上次崩溃可能残留）
+  cleanupAllTempDatabases()
+
  // 初始化 Worker
  try {
    worker.initWorker()
@@ -617,11 +629,11 @@ const mainIpcMain = (win: BrowserWindow) => {

  /**
   * 解析文件获取基本信息（用于合并预览）
-   * 使用流式解析获取进度，同时缓存完整解析结果
+   * 使用流式解析，数据写入临时数据库，避免内存溢出
   */
  ipcMain.handle('merge:parseFileInfo', async (_, filePath: string) => {
    try {
-      // 使用流式解析，避免大文件 OOM，同时获取完整解析结果
+      // 使用流式解析，写入临时数据库
      const result = await worker.streamParseFileInfo(filePath, (progress: ParseProgress) => {
        // 可选：发送进度到渲染进程
        win.webContents.send('merge:parseProgress', {
@@ -630,14 +642,14 @@ const mainIpcMain = (win: BrowserWindow) => {
        })
      })

-      // 缓存完整解析结果（用于后续合并）
-      // 这样即使用户删除本地文件，也能继续合并
-      if (result.parseResult) {
-        parseResultCache.set(filePath, result.parseResult)
-        console.log(`[IpcMain] 已缓存解析结果: ${filePath}, 消息数: ${result.parseResult.messages.length}`)
+      // 缓存临时数据库路径（用于后续合并）
+      // 这样即使用户删除本地文件，也能继续合并（数据已在临时数据库中）
+      if (result.tempDbPath) {
+        tempDbCache.set(filePath, result.tempDbPath)
+        console.log(`[IpcMain] 已缓存临时数据库: ${filePath} -> ${result.tempDbPath}`)
      }

-      // 返回基本信息（不包含完整解析结果，减少 IPC 传输）
+      // 返回基本信息
      return {
        name: result.name,
        format: result.format,
@@ -653,11 +665,11 @@ const mainIpcMain = (win: BrowserWindow) => {
  })

  /**
-   * 检测合并冲突（使用缓存的解析结果）
+   * 检测合并冲突（使用临时数据库）
   */
  ipcMain.handle('merge:checkConflicts', async (_, filePaths: string[]) => {
    try {
-      return merger.checkConflictsWithCache(filePaths, parseResultCache)
+      return merger.checkConflictsWithTempDb(filePaths, tempDbCache)
    } catch (error) {
      console.error('检测冲突失败：', error)
      throw error
@@ -665,15 +677,15 @@ const mainIpcMain = (win: BrowserWindow) => {
  })

  /**
-   * 执行合并（使用缓存的解析结果）
+   * 执行合并（使用临时数据库）
   */
  ipcMain.handle('merge:mergeFiles', async (_, params: MergeParams) => {
    try {
-      const result = await merger.mergeFilesWithCache(params, parseResultCache)
+      const result = await merger.mergeFilesWithTempDb(params, tempDbCache)
      // 合并完成后清理缓存
      if (result.success) {
        for (const filePath of params.filePaths) {
-          clearParseCache(filePath)
+          clearTempDbCache(filePath)
        }
      }
      return result
@@ -688,9 +700,9 @@ const mainIpcMain = (win: BrowserWindow) => {
   */
  ipcMain.handle('merge:clearCache', async (_, filePath?: string) => {
    if (filePath) {
-      clearParseCache(filePath)
+      clearTempDbCache(filePath)
    } else {
-      clearAllParseCache()
+      clearAllTempDbCache()
    }
    return true
  })
@@ -8,6 +8,7 @@ import * as path from 'path'
 import { app } from 'electron'
 import { parseFileSync, detectFormat } from '../parser'
 import { importData } from '../database/core'
+import { TempDbReader } from './tempCache'
 import type {
  ParseResult,
  ParsedMessage,
@@ -23,6 +24,8 @@ import type {
  ChatPlatform,
  ChatType,
  MergeSource,
+  ParsedMeta,
+  ParsedMember,
 } from '../../../src/types/chat'

 /**
@@ -192,6 +195,16 @@ export async function checkConflicts(filePaths: string[]): Promise<ConflictCheck
 /**
 * 内部函数：检测消息中的冲突
 */
+/**
+ * 检查消息是否是纯图片消息
+ * 纯图片消息格式如：[图片: xxx.jpg]、[图片: {xxx}.jpg] 等
+ */
+function isImageOnlyMessage(content: string | undefined): boolean {
+  if (!content) return false
+  // 匹配 [图片: xxx] 格式，允许各种图片名称格式
+  return /^\[图片:\s*.+\]$/.test(content.trim())
+}
+
 function detectConflictsInMessages(
  allMessages: Array<{ msg: ParsedMessage; source: string }>,
  conflicts: MergeConflict[]
@@ -214,6 +227,9 @@ function detectConflictsInMessages(
  }
  console.log(`[Merger] 有多条消息的时间戳数: ${multiMsgTsCount}`)

+  // 统计自动去重数量
+  let autoDeduplicatedCount = 0
+
  // 检测每个时间戳内的冲突
  for (const [ts, items] of timeGroups) {
    if (items.length < 2) continue
@@ -239,23 +255,36 @@ function detectConflictsInMessages(
        continue
      }

-      // 按内容长度分组
-      const lengthGroups = new Map<number, Array<{ msg: ParsedMessage; source: string }>>()
+      // 按内容分组（完全相同的内容会被分到一组，自动去重）
+      const contentGroups = new Map<string, Array<{ msg: ParsedMessage; source: string }>>()
      for (const item of senderItems) {
-        const len = (item.msg.content || '').length
-        if (!lengthGroups.has(len)) {
-          lengthGroups.set(len, [])
+        const content = item.msg.content || ''
+        if (!contentGroups.has(content)) {
+          contentGroups.set(content, [])
        }
-        lengthGroups.get(len)!.push(item)
+        contentGroups.get(content)!.push(item)
      }

-      // 如果有多个不同长度的消息，说明可能是冲突
-      if (lengthGroups.size > 1) {
-        const lengthEntries = Array.from(lengthGroups.entries())
-        for (let i = 0; i < lengthEntries.length - 1; i++) {
-          for (let j = i + 1; j < lengthEntries.length; j++) {
-            const [len1, items1] = lengthEntries[i]
-            const [len2, items2] = lengthEntries[j]
+      // 统计自动去重的消息（内容完全相同但来自不同文件）
+      for (const [, contentItems] of contentGroups) {
+        if (contentItems.length > 1) {
+          const contentSources = new Set(contentItems.map((it) => it.source))
+          if (contentSources.size > 1) {
+            // 内容相同但来自不同文件，自动去重
+            autoDeduplicatedCount += contentItems.length - 1
+          }
+        }
+      }
+
+      // 只有当有多个不同内容时才是真正的冲突
+      if (contentGroups.size > 1) {
+        const contentEntries = Array.from(contentGroups.entries())
+
+        // 检查这些不同内容是否来自不同文件
+        for (let i = 0; i < contentEntries.length - 1; i++) {
+          for (let j = i + 1; j < contentEntries.length; j++) {
+            const [content1, items1] = contentEntries[i]
+            const [content2, items2] = contentEntries[j]

            // 找到两个来源不同的消息
            const item1 = items1[0]
@@ -264,27 +293,29 @@ function detectConflictsInMessages(
            // 如果找不到来自不同文件的消息，跳过
            if (!item2) continue

+            // 如果两边都是纯图片消息，自动跳过（不需要用户选择）
+            if (isImageOnlyMessage(content1) && isImageOnlyMessage(content2)) {
+              autoDeduplicatedCount++
+              continue
+            }
+
            // 打印冲突详情
            if (conflicts.length < 5) {
              console.log(`[Merger] 冲突 #${conflicts.length + 1}:`)
              console.log(`  时间戳: ${ts} (${new Date(ts * 1000).toLocaleString()})`)
              console.log(`  发送者: ${sender} (${item1.msg.senderName})`)
-              console.log(
-                `  文件1: ${item1.source}, 长度: ${len1}, 内容: "${(item1.msg.content || '').slice(0, 50)}..."`
-              )
-              console.log(
-                `  文件2: ${item2.source}, 长度: ${len2}, 内容: "${(item2.msg.content || '').slice(0, 50)}..."`
-              )
+              console.log(`  文件1: ${item1.source}, 长度: ${content1.length}, 内容: "${content1.slice(0, 50)}..."`)
+              console.log(`  文件2: ${item2.source}, 长度: ${content2.length}, 内容: "${content2.slice(0, 50)}..."`)
            }

            conflicts.push({
              id: `conflict_${ts}_${sender}_${conflicts.length}`,
              timestamp: ts,
              sender: item1.msg.senderName || sender,
-              contentLength1: len1,
-              contentLength2: len2,
-              content1: item1.msg.content || '',
-              content2: item2.msg.content || '',
+              contentLength1: content1.length,
+              contentLength2: content2.length,
+              content1: content1,
+              content2: content2,
            })
          }
        }
@@ -292,6 +323,8 @@ function detectConflictsInMessages(
    }
  }

+  console.log(`[Merger] 自动去重消息数（含图片冲突）: ${autoDeduplicatedCount}`)
+
  console.log(`[Merger] 检测到冲突数: ${conflicts.length}`)

  // 计算去重后的消息数
@@ -531,3 +564,263 @@ function executeMerge(
    }
  }
 }
+
+// ==================== 临时数据库版本（方案3：内存优化） ====================
+
+/**
+ * 检测合并冲突（使用临时数据库，内存友好）
+ */
+export async function checkConflictsWithTempDb(
+  filePaths: string[],
+  tempDbCache: Map<string, string>
+): Promise<ConflictCheckResult> {
+  const allMessages: Array<{ msg: ParsedMessage; source: string }> = []
+  const conflicts: MergeConflict[] = []
+
+  console.log('[Merger] checkConflictsWithTempDb: 开始检测冲突')
+  console.log(
+    '[Merger] 文件列表:',
+    filePaths.map((p) => path.basename(p))
+  )
+  console.log(
+    '[Merger] 临时数据库缓存状态:',
+    filePaths.map((p) => `${path.basename(p)}: ${tempDbCache.has(p) ? '已缓存' : '未缓存'}`)
+  )
+
+  // 从临时数据库读取所有消息
+  const readers: TempDbReader[] = []
+  try {
+    for (const filePath of filePaths) {
+      const tempDbPath = tempDbCache.get(filePath)
+      if (!tempDbPath) {
+        throw new Error(`未找到文件的临时数据库: ${path.basename(filePath)}`)
+      }
+
+      const reader = new TempDbReader(tempDbPath)
+      readers.push(reader)
+
+      const meta = reader.getMeta()
+      const sourceName = path.basename(filePath)
+
+      console.log(`[Merger] 从临时数据库读取: ${sourceName}, 平台: ${meta?.platform}`)
+
+      // 流式读取消息，避免一次性加载到内存
+      reader.streamMessages(10000, (messages) => {
+        for (const msg of messages) {
+          allMessages.push({ msg, source: sourceName })
+        }
+      })
+    }
+
+    console.log(`[Merger] 总消息数: ${allMessages.length}`)
+
+    // 检查格式一致性
+    const platforms = readers.map((r) => r.getMeta()?.platform || 'unknown')
+    const uniquePlatforms = [...new Set(platforms)]
+    if (uniquePlatforms.length > 1) {
+      throw new Error(
+        `不支持合并不同格式的聊天记录。\n检测到的格式：${uniquePlatforms.join('、')}\n请确保所有文件使用相同的导出工具和格式。`
+      )
+    }
+    console.log('[Merger] 格式检查通过:', uniquePlatforms[0])
+
+    return detectConflictsInMessages(allMessages, conflicts)
+  } finally {
+    // 关闭所有 reader
+    for (const reader of readers) {
+      reader.close()
+    }
+  }
+}
+
+/**
+ * 合并多个聊天记录文件（使用临时数据库，内存友好）
+ */
+export async function mergeFilesWithTempDb(
+  params: MergeParams,
+  tempDbCache: Map<string, string>
+): Promise<MergeResult> {
+  const { filePaths, outputName, outputDir, conflictResolutions, andAnalyze } = params
+
+  console.log('[Merger] mergeFilesWithTempDb: 开始合并')
+  console.log(
+    '[Merger] 临时数据库缓存状态:',
+    filePaths.map((p) => `${path.basename(p)}: ${tempDbCache.has(p) ? '已缓存' : '未缓存'}`)
+  )
+
+  const readers: TempDbReader[] = []
+
+  try {
+    // 打开所有临时数据库
+    const parseResults: Array<{ meta: ParsedMeta; members: ParsedMember[]; source: string; reader: TempDbReader }> = []
+
+    for (const filePath of filePaths) {
+      const tempDbPath = tempDbCache.get(filePath)
+      if (!tempDbPath) {
+        throw new Error(`未找到文件的临时数据库: ${path.basename(filePath)}`)
+      }
+
+      const reader = new TempDbReader(tempDbPath)
+      readers.push(reader)
+
+      const meta = reader.getMeta()
+      if (!meta) {
+        throw new Error(`无法读取元信息: ${path.basename(filePath)}`)
+      }
+
+      const members = reader.getMembers()
+      const sourceName = path.basename(filePath)
+
+      console.log(`[Merger] 使用临时数据库: ${sourceName}`)
+
+      parseResults.push({ meta, members, source: sourceName, reader })
+    }
+
+    // 合并成员
+    const memberMap = new Map<string, ChatLabMember>()
+    for (const { members } of parseResults) {
+      for (const member of members) {
+        const existing = memberMap.get(member.platformId)
+        if (existing) {
+          if (existing.name !== member.name && !existing.aliases?.includes(member.name)) {
+            existing.aliases = existing.aliases || []
+            existing.aliases.push(member.name)
+          }
+        } else {
+          memberMap.set(member.platformId, {
+            platformId: member.platformId,
+            name: member.name,
+          })
+        }
+      }
+    }
+
+    // 流式合并消息（去重）- 使用 Set 替代 Map 以提高性能
+    // 注：冲突解决方案通过消息处理顺序生效（第一个被处理的版本会被保留）
+    const seenKeys = new Set<string>()
+    const mergedMessages: ChatLabMessage[] = []
+    let totalProcessed = 0
+    const startTime = Date.now()
+
+    for (const { reader, source } of parseResults) {
+      const readerStartTime = Date.now()
+      let readerCount = 0
+
+      reader.streamMessages(10000, (messages) => {
+        for (const msg of messages) {
+          const key = getMessageKey(msg)
+
+          // 跳过已处理的消息（去重）
+          if (seenKeys.has(key)) {
+            continue
+          }
+          seenKeys.add(key)
+
+          // 注：冲突已在去重时处理（seenKeys），用户选择的冲突解决方案
+          // 决定了哪个版本的消息先被处理，后续相同 key 的消息会被跳过
+
+          mergedMessages.push({
+            sender: msg.senderPlatformId,
+            name: msg.senderName,
+            timestamp: msg.timestamp,
+            type: msg.type,
+            content: msg.content,
+          })
+
+          readerCount++
+        }
+        totalProcessed += messages.length
+      })
+
+      console.log(`[Merger] 处理 ${source}: ${readerCount} 条唯一消息, 耗时: ${Date.now() - readerStartTime}ms`)
+    }
+
+    // 排序
+    const sortStartTime = Date.now()
+    mergedMessages.sort((a, b) => a.timestamp - b.timestamp)
+    console.log(`[Merger] 排序耗时: ${Date.now() - sortStartTime}ms`)
+
+    console.log(`[Merger] 合并后消息数: ${mergedMessages.length}`)
+
+    // 确定平台
+    const platforms = new Set(parseResults.map((r) => r.meta.platform))
+    const platform = platforms.size === 1 ? parseResults[0].meta.platform : 'mixed'
+
+    // 构建来源信息
+    const sources: MergeSource[] = parseResults.map(({ reader, source, meta }) => ({
+      filename: source,
+      platform: meta.platform,
+      messageCount: reader.getMessageCount(),
+    }))
+
+    // 构建 ChatLab 格式
+    const chatLabData: ChatLabFormat = {
+      chatlab: {
+        version: '1.0.0',
+        exportedAt: Math.floor(Date.now() / 1000),
+        generator: 'ChatLab Merge Tool',
+      },
+      meta: {
+        name: outputName,
+        platform: platform as ChatPlatform,
+        type: parseResults[0].meta.type as ChatType,
+        sources,
+      },
+      members: Array.from(memberMap.values()),
+      messages: mergedMessages,
+    }
+
+    // 写入文件（不格式化 JSON 以提高性能）
+    const targetDir = outputDir || getDefaultOutputDir()
+    ensureOutputDir(targetDir)
+    const filename = generateOutputFilename(outputName)
+    const outputPath = path.join(targetDir, filename)
+
+    const writeStartTime = Date.now()
+    fs.writeFileSync(outputPath, JSON.stringify(chatLabData), 'utf-8')
+    console.log(`[Merger] 写入文件耗时: ${Date.now() - writeStartTime}ms`)
+    console.log(`[Merger] 总合并耗时: ${Date.now() - startTime}ms`)
+
+    // 如果需要分析，导入数据库
+    let sessionId: string | undefined
+    if (andAnalyze) {
+      const importStartTime = Date.now()
+      const parseResult: ParseResult = {
+        meta: {
+          name: chatLabData.meta.name,
+          platform: chatLabData.meta.platform,
+          type: chatLabData.meta.type,
+        },
+        members: chatLabData.members.map((m) => ({
+          platformId: m.platformId,
+          name: m.name,
+        })),
+        messages: chatLabData.messages.map((msg) => ({
+          senderPlatformId: msg.sender,
+          senderName: msg.name,
+          timestamp: msg.timestamp,
+          type: msg.type,
+          content: msg.content,
+        })),
+      }
+      sessionId = importData(parseResult)
+      console.log(`[Merger] 导入数据库耗时: ${Date.now() - importStartTime}ms`)
+    }
+
+    return {
+      success: true,
+      outputPath,
+      sessionId,
+    }
+  } catch (err) {
+    return {
+      success: false,
+      error: err instanceof Error ? err.message : '合并失败',
+    }
+  } finally {
+    // 关闭所有 reader
+    for (const reader of readers) {
+      reader.close()
+    }
+  }
+}
@@ -0,0 +1,351 @@
+/**
+ * 临时数据库缓存管理器
+ * 用于合并功能：将解析结果存入临时 SQLite 数据库，避免内存溢出
+ */
+
+import Database from 'better-sqlite3'
+import * as fs from 'fs'
+import * as path from 'path'
+import { app } from 'electron'
+import type { ParseResult, ParsedMeta, ParsedMember, ParsedMessage } from '../../../src/types/chat'
+
+// 临时数据库目录
+let tempDir: string | null = null
+
+/**
+ * 获取临时数据库目录
+ */
+function getTempDir(): string {
+  if (tempDir) return tempDir
+
+  try {
+    const docPath = app.getPath('documents')
+    tempDir = path.join(docPath, 'ChatLab', 'temp')
+  } catch (error) {
+    console.error('[TempCache] Error getting documents path:', error)
+    tempDir = path.join(process.cwd(), 'temp')
+  }
+
+  // 确保目录存在
+  if (!fs.existsSync(tempDir)) {
+    fs.mkdirSync(tempDir, { recursive: true })
+  }
+
+  return tempDir
+}
+
+/**
+ * 生成临时数据库文件路径
+ */
+export function generateTempDbPath(sourceFilePath: string): string {
+  const timestamp = Date.now()
+  const random = Math.random().toString(36).substring(2, 8)
+  const baseName = path.basename(sourceFilePath, path.extname(sourceFilePath))
+  const safeName = baseName.replace(/[/\\?%*:|"<>]/g, '_').substring(0, 50)
+  return path.join(getTempDir(), `merge_${safeName}_${timestamp}_${random}.db`)
+}
+
+/**
+ * 创建临时数据库并初始化表结构
+ */
+export function createTempDatabase(dbPath: string): Database.Database {
+  const db = new Database(dbPath)
+
+  db.pragma('journal_mode = WAL')
+  db.pragma('synchronous = NORMAL')
+
+  db.exec(`
+    CREATE TABLE IF NOT EXISTS meta (
+      name TEXT NOT NULL,
+      platform TEXT NOT NULL,
+      type TEXT NOT NULL
+    );
+
+    CREATE TABLE IF NOT EXISTS member (
+      platform_id TEXT PRIMARY KEY,
+      name TEXT NOT NULL,
+      nickname TEXT
+    );
+
+    CREATE TABLE IF NOT EXISTS message (
+      id INTEGER PRIMARY KEY AUTOINCREMENT,
+      sender_platform_id TEXT NOT NULL,
+      sender_name TEXT NOT NULL,
+      timestamp INTEGER NOT NULL,
+      type INTEGER NOT NULL,
+      content TEXT
+    );
+
+    CREATE INDEX IF NOT EXISTS idx_message_ts ON message(timestamp);
+    CREATE INDEX IF NOT EXISTS idx_message_sender ON message(sender_platform_id);
+  `)
+
+  return db
+}
+
+/**
+ * 临时数据库写入器
+ * 用于流式写入解析结果
+ */
+export class TempDbWriter {
+  private db: Database.Database
+  private insertMeta: Database.Statement
+  private insertMember: Database.Statement
+  private insertMessage: Database.Statement
+  private memberSet: Set<string> = new Set()
+  private messageCount: number = 0
+
+  constructor(dbPath: string) {
+    this.db = createTempDatabase(dbPath)
+
+    // 准备语句
+    this.insertMeta = this.db.prepare(`
+      INSERT INTO meta (name, platform, type) VALUES (?, ?, ?)
+    `)
+    this.insertMember = this.db.prepare(`
+      INSERT OR IGNORE INTO member (platform_id, name, nickname) VALUES (?, ?, ?)
+    `)
+    this.insertMessage = this.db.prepare(`
+      INSERT INTO message (sender_platform_id, sender_name, timestamp, type, content)
+      VALUES (?, ?, ?, ?, ?)
+    `)
+
+    // 开始事务
+    this.db.exec('BEGIN TRANSACTION')
+  }
+
+  /**
+   * 写入元信息
+   */
+  writeMeta(meta: ParsedMeta): void {
+    this.insertMeta.run(meta.name, meta.platform, meta.type)
+  }
+
+  /**
+   * 写入成员（批量）
+   */
+  writeMembers(members: ParsedMember[]): void {
+    for (const m of members) {
+      if (!this.memberSet.has(m.platformId)) {
+        this.memberSet.add(m.platformId)
+        this.insertMember.run(m.platformId, m.name, m.nickname || null)
+      }
+    }
+  }
+
+  /**
+   * 写入消息（批量）
+   */
+  writeMessages(messages: ParsedMessage[]): void {
+    for (const msg of messages) {
+      // 确保成员存在
+      if (!this.memberSet.has(msg.senderPlatformId)) {
+        this.memberSet.add(msg.senderPlatformId)
+        this.insertMember.run(msg.senderPlatformId, msg.senderName, null)
+      }
+
+      this.insertMessage.run(msg.senderPlatformId, msg.senderName, msg.timestamp, msg.type, msg.content || null)
+      this.messageCount++
+    }
+  }
+
+  /**
+   * 完成写入（提交事务）
+   */
+  finish(): { messageCount: number; memberCount: number } {
+    this.db.exec('COMMIT')
+    const result = {
+      messageCount: this.messageCount,
+      memberCount: this.memberSet.size,
+    }
+    this.db.close()
+    return result
+  }
+
+  /**
+   * 取消写入（回滚事务）
+   */
+  abort(): void {
+    try {
+      this.db.exec('ROLLBACK')
+    } catch {
+      // 忽略回滚错误
+    }
+    this.db.close()
+  }
+}
+
+/**
+ * 临时数据库读取器
+ * 用于流式读取合并时的数据
+ */
+export class TempDbReader {
+  private db: Database.Database
+  private dbPath: string
+
+  constructor(dbPath: string) {
+    this.dbPath = dbPath
+    this.db = new Database(dbPath, { readonly: true })
+    this.db.pragma('journal_mode = WAL')
+  }
+
+  /**
+   * 读取元信息
+   */
+  getMeta(): ParsedMeta | null {
+    const row = this.db.prepare('SELECT * FROM meta LIMIT 1').get() as
+      | { name: string; platform: string; type: string }
+      | undefined
+    if (!row) return null
+    return {
+      name: row.name,
+      platform: row.platform,
+      type: row.type as 'group' | 'private',
+    }
+  }
+
+  /**
+   * 读取所有成员
+   */
+  getMembers(): ParsedMember[] {
+    const rows = this.db.prepare('SELECT * FROM member').all() as Array<{
+      platform_id: string
+      name: string
+      nickname: string | null
+    }>
+    return rows.map((r) => ({
+      platformId: r.platform_id,
+      name: r.name,
+      nickname: r.nickname || undefined,
+    }))
+  }
+
+  /**
+   * 获取消息总数
+   */
+  getMessageCount(): number {
+    const row = this.db.prepare('SELECT COUNT(*) as count FROM message').get() as { count: number }
+    return row.count
+  }
+
+  /**
+   * 流式读取消息（分批）
+   * @param batchSize 每批消息数量
+   * @param callback 处理每批消息的回调
+   */
+  streamMessages(batchSize: number, callback: (messages: ParsedMessage[]) => void): void {
+    const stmt = this.db.prepare(`
+      SELECT sender_platform_id, sender_name, timestamp, type, content
+      FROM message
+      ORDER BY timestamp ASC
+      LIMIT ? OFFSET ?
+    `)
+
+    let offset = 0
+    while (true) {
+      const rows = stmt.all(batchSize, offset) as Array<{
+        sender_platform_id: string
+        sender_name: string
+        timestamp: number
+        type: number
+        content: string | null
+      }>
+
+      if (rows.length === 0) break
+
+      const messages: ParsedMessage[] = rows.map((r) => ({
+        senderPlatformId: r.sender_platform_id,
+        senderName: r.sender_name,
+        timestamp: r.timestamp,
+        type: r.type,
+        content: r.content || undefined,
+      }))
+
+      callback(messages)
+      offset += batchSize
+    }
+  }
+
+  /**
+   * 获取所有消息（用于冲突检测，内存中处理）
+   * 注意：对于超大文件，应使用 streamMessages
+   */
+  getAllMessages(): ParsedMessage[] {
+    const rows = this.db
+      .prepare(
+        `
+      SELECT sender_platform_id, sender_name, timestamp, type, content
+      FROM message
+      ORDER BY timestamp ASC
+    `
+      )
+      .all() as Array<{
+      sender_platform_id: string
+      sender_name: string
+      timestamp: number
+      type: number
+      content: string | null
+    }>
+
+    return rows.map((r) => ({
+      senderPlatformId: r.sender_platform_id,
+      senderName: r.sender_name,
+      timestamp: r.timestamp,
+      type: r.type,
+      content: r.content || undefined,
+    }))
+  }
+
+  /**
+   * 关闭数据库连接
+   */
+  close(): void {
+    this.db.close()
+  }
+
+  /**
+   * 获取数据库路径
+   */
+  getPath(): string {
+    return this.dbPath
+  }
+}
+
+/**
+ * 删除临时数据库文件
+ */
+export function deleteTempDatabase(dbPath: string): void {
+  try {
+    const walPath = dbPath + '-wal'
+    const shmPath = dbPath + '-shm'
+
+    if (fs.existsSync(dbPath)) fs.unlinkSync(dbPath)
+    if (fs.existsSync(walPath)) fs.unlinkSync(walPath)
+    if (fs.existsSync(shmPath)) fs.unlinkSync(shmPath)
+
+    console.log(`[TempCache] 已删除临时数据库: ${dbPath}`)
+  } catch (error) {
+    console.error(`[TempCache] 删除临时数据库失败: ${dbPath}`, error)
+  }
+}
+
+/**
+ * 清理所有临时数据库（应用启动时调用）
+ */
+export function cleanupAllTempDatabases(): void {
+  try {
+    const dir = getTempDir()
+    if (!fs.existsSync(dir)) return
+
+    const files = fs.readdirSync(dir)
+    for (const file of files) {
+      if (file.startsWith('merge_') && file.endsWith('.db')) {
+        const filePath = path.join(dir, file)
+        deleteTempDatabase(filePath)
+      }
+    }
+    console.log('[TempCache] 已清理所有临时数据库')
+  } catch (error) {
+    console.error('[TempCache] 清理临时数据库失败:', error)
+  }
+}
@@ -0,0 +1,112 @@
+/**
+ * 性能日志模块
+ * 实时记录导入过程的性能指标
+ */
+
+import * as fs from 'fs'
+import * as path from 'path'
+import { getDbDir } from './dbCore'
+
+// 状态
+let lastLogTime = Date.now()
+let lastMessageCount = 0
+let currentLogFile: string | null = null
+
+/**
+ * 获取性能日志目录
+ */
+function getLogDir(): string {
+  const dbDir = getDbDir()
+  const logDir = path.join(path.dirname(dbDir), 'logs')
+  if (!fs.existsSync(logDir)) {
+    fs.mkdirSync(logDir, { recursive: true })
+  }
+  return logDir
+}
+
+/**
+ * 初始化日志文件（实时写入）
+ */
+export function initPerfLog(sessionId: string): void {
+  try {
+    const logDir = getLogDir()
+    currentLogFile = path.join(logDir, `import_${sessionId}_${Date.now()}.log`)
+    // 写入头部
+    fs.writeFileSync(currentLogFile, `=== 导入性能日志 ===\n开始时间: ${new Date().toISOString()}\n\n`, 'utf-8')
+    console.log(`[PerfLog] 日志文件: ${currentLogFile}`)
+  } catch (e) {
+    console.error('[PerfLog] 初始化日志文件失败:', e)
+  }
+}
+
+/**
+ * 实时记录性能日志（每次追加写入文件）
+ */
+export function logPerf(event: string, messagesProcessed: number, batchSize?: number): void {
+  const now = Date.now()
+  const duration = now - lastLogTime
+  const messagesDelta = messagesProcessed - lastMessageCount
+  const speed = duration > 0 ? Math.round((messagesDelta / duration) * 1000) : 0
+
+  // 获取内存使用
+  let memory = 0
+  try {
+    const used = process.memoryUsage()
+    memory = Math.round(used.heapUsed / 1024 / 1024)
+  } catch {
+    // 忽略
+  }
+
+  const logLine =
+    `[${new Date().toISOString()}] ${event} | ` +
+    `消息: ${messagesProcessed.toLocaleString()} | ` +
+    `耗时: ${duration}ms | ` +
+    `速度: ${speed.toLocaleString()}/秒 | ` +
+    `内存: ${memory}MB` +
+    (batchSize ? ` | 批次: ${batchSize}` : '') +
+    '\n'
+
+  // 控制台输出
+  console.log(`[PerfLog] ${logLine.trim()}`)
+
+  // 实时写入文件
+  if (currentLogFile) {
+    try {
+      fs.appendFileSync(currentLogFile, logLine, 'utf-8')
+    } catch (e) {
+      console.error('[PerfLog] 写入日志失败:', e)
+    }
+  }
+
+  lastLogTime = now
+  lastMessageCount = messagesProcessed
+}
+
+/**
+ * 追加详细日志（分阶段耗时）
+ */
+export function logPerfDetail(detail: string): void {
+  if (currentLogFile) {
+    try {
+      fs.appendFileSync(currentLogFile, `  ${detail}\n`, 'utf-8')
+    } catch {
+      // 忽略
+    }
+  }
+}
+
+/**
+ * 重置性能日志状态
+ */
+export function resetPerfLog(): void {
+  lastLogTime = Date.now()
+  lastMessageCount = 0
+  currentLogFile = null
+}
+
+/**
+ * 获取当前日志文件路径
+ */
+export function getCurrentLogFile(): string | null {
+  return currentLogFile
+}
@@ -16,7 +16,6 @@ import {
  type ParsedMeta,
  type ParsedMember,
  type ParsedMessage,
-  getFileSize,
 } from '../parser'

 /** 流式导入结果 */
@@ -26,6 +25,70 @@ export interface StreamImportResult {
  error?: string
 }
 import { getDbDir } from './dbCore'
+import { initPerfLog, logPerf, logPerfDetail, resetPerfLog, getCurrentLogFile } from './perfLogger'
+
+// ==================== 临时数据库相关（用于合并功能） ====================
+
+/**
+ * 获取临时数据库目录（Worker 环境）
+ */
+function getTempDir(): string {
+  const dbDir = getDbDir()
+  const tempDir = path.join(path.dirname(dbDir), 'temp')
+  if (!fs.existsSync(tempDir)) {
+    fs.mkdirSync(tempDir, { recursive: true })
+  }
+  return tempDir
+}
+
+/**
+ * 生成临时数据库文件路径
+ */
+function generateTempDbPath(sourceFilePath: string): string {
+  const timestamp = Date.now()
+  const random = Math.random().toString(36).substring(2, 8)
+  const baseName = path.basename(sourceFilePath, path.extname(sourceFilePath))
+  const safeName = baseName.replace(/[/\\?%*:|"<>]/g, '_').substring(0, 50)
+  return path.join(getTempDir(), `merge_${safeName}_${timestamp}_${random}.db`)
+}
+
+/**
+ * 创建临时数据库并初始化表结构
+ */
+function createTempDatabase(dbPath: string): Database.Database {
+  const db = new Database(dbPath)
+
+  db.pragma('journal_mode = WAL')
+  db.pragma('synchronous = NORMAL')
+
+  db.exec(`
+    CREATE TABLE IF NOT EXISTS meta (
+      name TEXT NOT NULL,
+      platform TEXT NOT NULL,
+      type TEXT NOT NULL
+    );
+
+    CREATE TABLE IF NOT EXISTS member (
+      platform_id TEXT PRIMARY KEY,
+      name TEXT NOT NULL,
+      nickname TEXT
+    );
+
+    CREATE TABLE IF NOT EXISTS message (
+      id INTEGER PRIMARY KEY AUTOINCREMENT,
+      sender_platform_id TEXT NOT NULL,
+      sender_name TEXT NOT NULL,
+      timestamp INTEGER NOT NULL,
+      type INTEGER NOT NULL,
+      content TEXT
+    );
+
+    CREATE INDEX IF NOT EXISTS idx_message_ts ON message(timestamp);
+    CREATE INDEX IF NOT EXISTS idx_message_sender ON message(sender_platform_id);
+  `)
+
+  return db
+}

 /**
 * 发送进度到主进程
@@ -55,9 +118,9 @@ function getDbPath(sessionId: string): string {
 }

 /**
- * 创建数据库并初始化表结构
+ * 创建数据库并初始化表结构（不含索引，用于快速导入）
 */
-function createDatabase(sessionId: string): Database.Database {
+function createDatabaseWithoutIndexes(sessionId: string): Database.Database {
  const dbDir = getDbDir()
  if (!fs.existsSync(dbDir)) {
    fs.mkdirSync(dbDir, { recursive: true })
@@ -68,7 +131,10 @@ function createDatabase(sessionId: string): Database.Database {

  db.pragma('journal_mode = WAL')
  db.pragma('synchronous = NORMAL')
+  // 增加缓存大小以提高写入性能
+  db.pragma('cache_size = -64000') // 64MB 缓存

+  // 创建表结构（不创建索引，导入完成后再创建）
  db.exec(`
    CREATE TABLE IF NOT EXISTS meta (
      name TEXT NOT NULL,
@@ -101,13 +167,25 @@ function createDatabase(sessionId: string): Database.Database {
      content TEXT,
      FOREIGN KEY(sender_id) REFERENCES member(id)
    );
+  `)

+  return db
+}
+
+/**
+ * 导入完成后创建索引
+ */
+function createIndexes(db: Database.Database): void {
+  console.log('[StreamImport] 开始创建索引...')
+  const startTime = Date.now()
+
+  db.exec(`
    CREATE INDEX IF NOT EXISTS idx_message_ts ON message(ts);
    CREATE INDEX IF NOT EXISTS idx_message_sender ON message(sender_id);
    CREATE INDEX IF NOT EXISTS idx_member_name_history_member_id ON member_name_history(member_id);
  `)

-  return db
+  console.log(`[StreamImport] 索引创建完成，耗时: ${Date.now() - startTime}ms`)
 }

 /**
@@ -124,6 +202,12 @@ export async function streamImport(filePath: string, requestId: string): Promise

  console.log(`[StreamImport] 开始导入: ${filePath}, 格式: ${formatFeature.name}`)

+  // 初始化性能日志（实时写入文件）
+  resetPerfLog()
+  const sessionId = generateSessionId()
+  initPerfLog(sessionId)
+  logPerf('开始导入', 0)
+
  // 预处理：如果格式需要且文件较大，先精简
  let actualFilePath = filePath
  let tempFilePath: string | null = null
@@ -158,8 +242,7 @@ export async function streamImport(filePath: string, requestId: string): Promise
    }
  }

-  const sessionId = generateSessionId()
-  const db = createDatabase(sessionId)
+  const db = createDatabaseWithoutIndexes(sessionId)

  // 准备语句
  const insertMeta = db.prepare(`
@@ -176,19 +259,79 @@ export async function streamImport(filePath: string, requestId: string): Promise
    INSERT INTO member_name_history (member_id, name, start_ts, end_ts) VALUES (?, ?, ?, ?)
  `)
  const updateMemberName = db.prepare(`UPDATE member SET name = ? WHERE platform_id = ?`)
-  const updateNameHistoryEndTs = db.prepare(`
-    UPDATE member_name_history SET end_ts = ? WHERE member_id = ? AND end_ts IS NULL
-  `)

  // 成员ID映射（platformId -> dbId）
  const memberIdMap = new Map<string, number>()
-  // 昵称追踪器
-  const nicknameTracker = new Map<string, { currentName: string; lastSeenTs: number }>()
+  // 昵称追踪器（收集所有变化，最后批量写入）
+  const nicknameTracker = new Map<
+    string,
+    {
+      currentName: string
+      lastSeenTs: number
+      history: Array<{ name: string; startTs: number }>
+    }
+  >()
  // 是否已插入 meta
  let metaInserted = false

-  // 开始事务（整个导入作为一个大事务，提高性能）
-  db.exec('BEGIN TRANSACTION')
+  // 分批提交配置（每 50000 条消息提交一次）
+  const BATCH_COMMIT_SIZE = 50000
+  // WAL checkpoint 间隔（每 200000 条执行一次 checkpoint）
+  const CHECKPOINT_INTERVAL = 200000
+  let messageCountInBatch = 0
+  let totalMessageCount = 0
+  let lastCheckpointCount = 0
+  let inTransaction = false
+
+  // 开始第一个事务
+  const beginTransaction = () => {
+    if (!inTransaction) {
+      db.exec('BEGIN TRANSACTION')
+      inTransaction = true
+    }
+  }
+
+  // 执行 WAL checkpoint（将 WAL 日志合并到主数据库）
+  const doCheckpoint = () => {
+    try {
+      db.pragma('wal_checkpoint(TRUNCATE)')
+      console.log(`[StreamImport] WAL checkpoint 完成，累计 ${totalMessageCount} 条`)
+    } catch (e) {
+      console.warn('[StreamImport] WAL checkpoint 失败:', e)
+    }
+  }
+
+  // 提交当前事务并开始新事务
+  const commitAndBeginNew = () => {
+    if (inTransaction) {
+      db.exec('COMMIT')
+      inTransaction = false
+
+      // 记录性能日志
+      logPerf(`提交事务`, totalMessageCount, BATCH_COMMIT_SIZE)
+
+      // 定期执行 WAL checkpoint（防止 WAL 文件过大导致变慢）
+      if (totalMessageCount - lastCheckpointCount >= CHECKPOINT_INTERVAL) {
+        doCheckpoint()
+        logPerf('WAL checkpoint', totalMessageCount)
+        lastCheckpointCount = totalMessageCount
+      }
+
+      console.log(`[StreamImport] 已提交事务，累计 ${totalMessageCount} 条消息`)
+      // 发送写入进度
+      sendProgress(requestId, {
+        stage: 'importing',
+        bytesRead: 0,
+        totalBytes: 0,
+        messagesProcessed: totalMessageCount,
+        percentage: 100,
+        message: `正在写入数据库... 已处理 ${totalMessageCount.toLocaleString()} 条`,
+      })
+    }
+    beginTransaction()
+  }
+
+  beginTransaction()

  try {
    await streamParseFile(actualFilePath, {
@@ -219,22 +362,29 @@ export async function streamImport(filePath: string, requestId: string): Promise
      },

      onMessageBatch: (messages: ParsedMessage[]) => {
+        // 分阶段计时
+        let memberLookupTime = 0
+        let memberInsertTime = 0
+        let messageInsertTime = 0
+        let nicknameTrackTime = 0
+        let memberLookupCount = 0
+        let memberInsertCount = 0
+        let nicknameChangeCount = 0
+
        for (const msg of messages) {
          // 数据验证：跳过无效消息
          if (!msg.senderPlatformId || !msg.senderName) {
-            console.warn('[StreamImport] 跳过无效消息：缺少发送者信息')
            continue
          }
          if (msg.timestamp === undefined || msg.timestamp === null || isNaN(msg.timestamp)) {
-            console.warn('[StreamImport] 跳过无效消息：缺少时间戳')
            continue
          }
          if (msg.type === undefined || msg.type === null) {
-            console.warn('[StreamImport] 跳过无效消息：缺少消息类型')
            continue
          }

          // 确保成员存在
+          let t0 = Date.now()
          if (!memberIdMap.has(msg.senderPlatformId)) {
            const memberName = msg.senderName || msg.senderPlatformId
            insertMember.run(msg.senderPlatformId, memberName, null)
@@ -242,48 +392,146 @@ export async function streamImport(filePath: string, requestId: string): Promise
            if (row) {
              memberIdMap.set(msg.senderPlatformId, row.id)
            }
+            memberInsertCount++
+            memberInsertTime += Date.now() - t0
+          } else {
+            memberLookupCount++
+            memberLookupTime += Date.now() - t0
          }

          const senderId = memberIdMap.get(msg.senderPlatformId)
          if (senderId === undefined) continue

          // 插入消息
+          t0 = Date.now()
          insertMessage.run(senderId, msg.timestamp, msg.type, msg.content)
+          messageInsertTime += Date.now() - t0
+          messageCountInBatch++
+          totalMessageCount++

-          // 追踪昵称变化
+          // 追踪昵称变化（仅记录，不写入数据库，最后批量处理）
+          t0 = Date.now()
          const senderName = msg.senderName || msg.senderPlatformId
          const tracker = nicknameTracker.get(msg.senderPlatformId)
          if (!tracker) {
            nicknameTracker.set(msg.senderPlatformId, {
              currentName: senderName,
              lastSeenTs: msg.timestamp,
+              history: [{ name: senderName, startTs: msg.timestamp }],
            })
-            insertNameHistory.run(senderId, senderName, msg.timestamp, null)
+            nicknameChangeCount++
          } else if (tracker.currentName !== senderName) {
-            updateNameHistoryEndTs.run(msg.timestamp, senderId)
-            insertNameHistory.run(senderId, senderName, msg.timestamp, null)
+            // 记录昵称变化（稍后批量写入）
+            tracker.history.push({ name: senderName, startTs: msg.timestamp })
            tracker.currentName = senderName
            tracker.lastSeenTs = msg.timestamp
+            nicknameChangeCount++
          } else {
            tracker.lastSeenTs = msg.timestamp
          }
+          nicknameTrackTime += Date.now() - t0
+
+          // 分批提交（每 50000 条）
+          if (messageCountInBatch >= BATCH_COMMIT_SIZE) {
+            // 记录详细分阶段耗时
+            const detail =
+              `[详细] 成员查找: ${memberLookupTime}ms (${memberLookupCount}次) | ` +
+              `成员插入: ${memberInsertTime}ms (${memberInsertCount}次) | ` +
+              `消息插入: ${messageInsertTime}ms | ` +
+              `昵称追踪: ${nicknameTrackTime}ms (变化${nicknameChangeCount}次)`
+            logPerfDetail(detail)
+
+            commitAndBeginNew()
+            messageCountInBatch = 0
+
+            // 重置计时
+            memberLookupTime = 0
+            memberInsertTime = 0
+            messageInsertTime = 0
+            nicknameTrackTime = 0
+            memberLookupCount = 0
+            memberInsertCount = 0
+            nicknameChangeCount = 0
+          }
        }
      },
    })

-    // 更新成员的最新昵称
-    for (const [platformId, tracker] of nicknameTracker.entries()) {
-      updateMemberName.run(tracker.currentName, platformId)
+    // 提交最后的消息事务
+    if (inTransaction) {
+      db.exec('COMMIT')
+      inTransaction = false
    }

-    // 提交事务
-    db.exec('COMMIT')
+    // 批量写入昵称历史（在索引创建前，写入速度更快）
+    sendProgress(requestId, {
+      stage: 'importing',
+      bytesRead: 0,
+      totalBytes: 0,
+      messagesProcessed: totalMessageCount,
+      percentage: 100,
+      message: '正在写入昵称历史...',
+    })
+    logPerf('开始写入昵称历史', totalMessageCount)

-    console.log(`[StreamImport] 导入完成: ${sessionId}`)
+    // 开始新事务
+    db.exec('BEGIN TRANSACTION')
+    let historyCount = 0
+    for (const [platformId, tracker] of nicknameTracker.entries()) {
+      const senderId = memberIdMap.get(platformId)
+      if (!senderId) continue
+
+      // 写入所有昵称历史
+      for (let i = 0; i < tracker.history.length; i++) {
+        const h = tracker.history[i]
+        const endTs = i < tracker.history.length - 1 ? tracker.history[i + 1].startTs : null
+        insertNameHistory.run(senderId, h.name, h.startTs, endTs)
+        historyCount++
+      }
+
+      // 更新成员最新昵称
+      updateMemberName.run(tracker.currentName, platformId)
+    }
+    db.exec('COMMIT')
+    logPerf(`昵称历史写入完成 (${historyCount}条)`, totalMessageCount)
+
+    // 创建索引（导入完成后批量创建，比边导入边更新快很多）
+    sendProgress(requestId, {
+      stage: 'importing',
+      bytesRead: 0,
+      totalBytes: 0,
+      messagesProcessed: totalMessageCount,
+      percentage: 100,
+      message: '正在创建索引...',
+    })
+    logPerf('开始创建索引', totalMessageCount)
+    createIndexes(db)
+    logPerf('索引创建完成', totalMessageCount)
+
+    // 最终 WAL checkpoint
+    sendProgress(requestId, {
+      stage: 'importing',
+      bytesRead: 0,
+      totalBytes: 0,
+      messagesProcessed: totalMessageCount,
+      percentage: 100,
+      message: '正在优化数据库...',
+    })
+    doCheckpoint()
+    logPerf('WAL checkpoint 完成', totalMessageCount)
+    logPerf('导入完成', totalMessageCount)
+
+    console.log(`[StreamImport] 导入完成: ${sessionId}, 总消息数: ${totalMessageCount}`)
    return { success: true, sessionId }
  } catch (error) {
-    // 回滚事务
-    db.exec('ROLLBACK')
+    // 回滚当前事务
+    if (inTransaction) {
+      try {
+        db.exec('ROLLBACK')
+      } catch {
+        // 忽略回滚错误
+      }
+    }

    // 删除失败的数据库文件
    const dbPath = getDbPath(sessionId)
@@ -316,17 +564,13 @@ export interface StreamParseFileInfoResult {
  messageCount: number
  memberCount: number
  fileSize: number
-  // 完整解析结果（用于后续合并，避免重复解析）
-  parseResult: {
-    meta: ParsedMeta
-    members: ParsedMember[]
-    messages: ParsedMessage[]
-  }
+  // 临时数据库路径（用于后续合并，避免内存溢出）
+  tempDbPath: string
 }

 /**
- * 流式解析文件获取基本信息和完整解析结果
- * 用于合并功能的预览，同时缓存完整结果供后续合并使用
+ * 流式解析文件，写入临时数据库
+ * 用于合并功能：解析结果存入临时 SQLite，避免内存溢出
 */
 export async function streamParseFileInfo(filePath: string, requestId: string): Promise<StreamParseFileInfoResult> {
  const formatFeature = detectFormat(filePath)
@@ -347,51 +591,95 @@ export async function streamParseFileInfo(filePath: string, requestId: string):
    message: '正在读取文件...',
  })

+  // 创建临时数据库
+  const tempDbPath = generateTempDbPath(filePath)
+  const db = createTempDatabase(tempDbPath)
+
+  // 准备语句
+  const insertMeta = db.prepare('INSERT INTO meta (name, platform, type) VALUES (?, ?, ?)')
+  const insertMember = db.prepare('INSERT OR IGNORE INTO member (platform_id, name, nickname) VALUES (?, ?, ?)')
+  const insertMessage = db.prepare(`
+    INSERT INTO message (sender_platform_id, sender_name, timestamp, type, content)
+    VALUES (?, ?, ?, ?, ?)
+  `)
+
  let meta: ParsedMeta = { name: '未知群聊', platform: formatFeature.platform, type: 'group' }
-  const members: ParsedMember[] = []
-  const messages: ParsedMessage[] = []
  const memberSet = new Set<string>()
+  let messageCount = 0
+  let metaInserted = false

-  await streamParseFile(filePath, {
-    // 对于大文件使用更小的批次，以更频繁地更新进度
-    batchSize: fileSize > 100 * 1024 * 1024 ? 2000 : 5000,
+  // 开始事务
+  db.exec('BEGIN TRANSACTION')

-    onProgress: (progress) => {
-      sendProgress(requestId, progress)
-    },
+  try {
+    await streamParseFile(filePath, {
+      // 对于大文件使用更小的批次，以更频繁地更新进度
+      batchSize: fileSize > 100 * 1024 * 1024 ? 2000 : 5000,

-    onMeta: (parsedMeta) => {
-      meta = parsedMeta
-    },
+      onProgress: (progress) => {
+        sendProgress(requestId, progress)
+      },

-    onMembers: (parsedMembers) => {
-      for (const m of parsedMembers) {
-        if (!memberSet.has(m.platformId)) {
-          memberSet.add(m.platformId)
-          members.push(m)
+      onMeta: (parsedMeta) => {
+        meta = parsedMeta
+        if (!metaInserted) {
+          insertMeta.run(parsedMeta.name, parsedMeta.platform, parsedMeta.type)
+          metaInserted = true
        }
-      }
-    },
+      },

-    onMessageBatch: (batch) => {
-      messages.push(...batch)
-      for (const msg of batch) {
-        memberSet.add(msg.senderPlatformId)
-      }
-    },
-  })
+      onMembers: (parsedMembers) => {
+        for (const m of parsedMembers) {
+          if (!memberSet.has(m.platformId)) {
+            memberSet.add(m.platformId)
+            insertMember.run(m.platformId, m.name, m.nickname || null)
+          }
+        }
+      },

-  return {
-    name: meta.name,
-    format: formatFeature.name,
-    platform: meta.platform,
-    messageCount: messages.length,
-    memberCount: memberSet.size,
-    fileSize,
-    parseResult: {
-      meta,
-      members,
-      messages,
-    },
+      onMessageBatch: (batch) => {
+        for (const msg of batch) {
+          // 确保成员存在
+          if (!memberSet.has(msg.senderPlatformId)) {
+            memberSet.add(msg.senderPlatformId)
+            insertMember.run(msg.senderPlatformId, msg.senderName, null)
+          }
+
+          insertMessage.run(msg.senderPlatformId, msg.senderName, msg.timestamp, msg.type, msg.content || null)
+          messageCount++
+        }
+      },
+    })
+
+    // 提交事务
+    db.exec('COMMIT')
+    db.close()
+
+    console.log(`[StreamImport] 已写入临时数据库: ${tempDbPath}, 消息数: ${messageCount}`)
+
+    return {
+      name: meta.name,
+      format: formatFeature.name,
+      platform: meta.platform,
+      messageCount,
+      memberCount: memberSet.size,
+      fileSize,
+      tempDbPath,
+    }
+  } catch (error) {
+    // 回滚并清理
+    try {
+      db.exec('ROLLBACK')
+    } catch {
+      // 忽略回滚错误
+    }
+    db.close()
+
+    // 删除失败的临时数据库
+    if (fs.existsSync(tempDbPath)) {
+      fs.unlinkSync(tempDbPath)
+    }
+
+    throw error
  }
 }
@@ -314,7 +314,8 @@ export async function parseFileInfo(filePath: string): Promise<any> {
 }

 /**
- * 流式解析文件获取基本信息和完整解析结果（用于合并预览）
+ * 流式解析文件，写入临时数据库（用于合并功能）
+ * 返回基本信息和临时数据库路径
 */
 export async function streamParseFileInfo(
  filePath: string,
@@ -326,17 +327,7 @@ export async function streamParseFileInfo(
  messageCount: number
  memberCount: number
  fileSize: number
-  parseResult: {
-    meta: { name: string; platform: string; type: string }
-    members: Array<{ platformId: string; name: string; nickname?: string }>
-    messages: Array<{
-      senderPlatformId: string
-      senderName: string
-      timestamp: number
-      type: number
-      content?: string
-    }>
-  }
+  tempDbPath: string
 }> {
  return sendToWorkerWithProgress('streamParseFileInfo', { filePath }, onProgress)
 }
@@ -48,6 +48,10 @@ const mergeProgress = ref(0)
 const currentStep = ref<'select' | 'conflict' | 'done'>('select')
 const outputFilePath = ref('')

+// 分页相关
+const currentPage = ref(1)
+const pageSize = 20
+
 // 解析进度监听
 let unsubscribeProgress: (() => void) | null = null

@@ -198,6 +202,7 @@ async function doMerge() {

    if (checkResult.conflicts.length > 0) {
      conflicts.value = checkResult.conflicts
+      currentPage.value = 1 // 重置分页
      currentStep.value = 'conflict'
      isMerging.value = false
      return
@@ -305,6 +310,20 @@ function getStatusColor(status: FileInfo['status']): string {
 // 计算已解决的冲突数
 const resolvedCount = computed(() => conflicts.value.filter((c) => c.resolution).length)

+// 分页相关计算属性
+const totalPages = computed(() => Math.ceil(conflicts.value.length / pageSize))
+const paginatedConflicts = computed(() => {
+  const start = (currentPage.value - 1) * pageSize
+  return conflicts.value.slice(start, start + pageSize)
+})
+
+// 分页导航
+function goToPage(page: number) {
+  if (page >= 1 && page <= totalPages.value) {
+    currentPage.value = page
+  }
+}
+
 // 批量选择所有冲突
 function batchSelectAll(resolution: 'keep1' | 'keep2' | 'keepBoth') {
  for (const conflict of conflicts.value) {
@@ -493,14 +512,14 @@ const file2Name = computed(() => files.value[1]?.name || '文件 2')

        <!-- 冲突列表 -->
        <div class="max-h-[400px] divide-y divide-gray-200 overflow-y-auto dark:divide-gray-800">
-          <div v-for="(conflict, index) in conflicts" :key="conflict.id" class="p-4">
+          <div v-for="(conflict, index) in paginatedConflicts" :key="conflict.id" class="p-4">
            <!-- 冲突信息 -->
            <div class="mb-3 flex items-center justify-between">
              <div class="flex items-center gap-2">
                <span
                  class="flex h-6 w-6 items-center justify-center rounded-full bg-gray-200 text-xs font-medium dark:bg-gray-700"
                >
-                  {{ index + 1 }}
+                  {{ (currentPage - 1) * pageSize + index + 1 }}
                </span>
                <span class="text-sm text-gray-600 dark:text-gray-400">{{ conflict.sender }}</span>
              </div>
@@ -564,6 +583,50 @@ const file2Name = computed(() => files.value[1]?.name || '文件 2')
          </div>
        </div>

+        <!-- 分页控件（仅当冲突数 > 20 时显示） -->
+        <div
+          v-if="totalPages > 1"
+          class="flex items-center justify-center gap-2 border-t border-gray-200 bg-gray-50 px-5 py-3 dark:border-gray-800 dark:bg-gray-800/50"
+        >
+          <UButton
+            size="xs"
+            color="gray"
+            variant="ghost"
+            icon="i-heroicons-chevron-left"
+            :disabled="currentPage === 1"
+            @click="goToPage(currentPage - 1)"
+          />
+          <div class="flex items-center gap-1">
+            <template v-for="page in totalPages" :key="page">
+              <UButton
+                v-if="page === 1 || page === totalPages || Math.abs(page - currentPage) <= 1"
+                size="xs"
+                :color="page === currentPage ? 'primary' : 'gray'"
+                :variant="page === currentPage ? 'soft' : 'ghost'"
+                @click="goToPage(page)"
+              >
+                {{ page }}
+              </UButton>
+              <span v-else-if="page === 2 && currentPage > 3" class="px-1 text-xs text-gray-400">...</span>
+              <span
+                v-else-if="page === totalPages - 1 && currentPage < totalPages - 2"
+                class="px-1 text-xs text-gray-400"
+              >
+                ...
+              </span>
+            </template>
+          </div>
+          <UButton
+            size="xs"
+            color="gray"
+            variant="ghost"
+            icon="i-heroicons-chevron-right"
+            :disabled="currentPage === totalPages"
+            @click="goToPage(currentPage + 1)"
+          />
+          <span class="ml-2 text-xs text-gray-500">第 {{ currentPage }} / {{ totalPages }} 页</span>
+        </div>
+
        <!-- 底部操作 -->
        <div class="flex items-center justify-between border-t border-gray-200 px-5 py-4 dark:border-gray-800">
          <UButton color="gray" variant="ghost" @click="currentStep = 'select'">