fix: recovery sweep touches updated_at after re-enqueue to prevent duplicate flooding every 5 min

2026-04-16 19:13:10 +00:00
parent 693d9e0d60
commit 1a5fb2e36a
1 changed files with 9 additions and 0 deletions
@@ -534,6 +534,7 @@ async def recover_stale_documents(pool: asyncpg.Pool, rds: aioredis.Redis) -> in
        return 0
    enqueued = 0
    doc_ids = []
    for row in rows:
        doc_type = row["document_type"]
        if doc_type == "macro_event":
@@ -545,8 +546,16 @@ async def recover_stale_documents(pool: asyncpg.Pool, rds: aioredis.Redis) -> in
            "document_id": str(row["id"]),
            "ticker": row["ticker"] or "",
        }))
        doc_ids.append(row["id"])
        enqueued += 1
    # Touch updated_at so these docs won't be re-enqueued until the threshold passes again
    if doc_ids:
        await pool.execute(
            "UPDATE documents SET updated_at = NOW() WHERE id = ANY($1::uuid[])",
            doc_ids,
        )
    logger.info("Recovered %d stale parsed documents for extraction", enqueued)
    return enqueued