python实现把其他sql server数据库的某些表的前一天数据定时存储到自己数据库同名的表中

🕗 发布于 2024-07-18 08:03 数据库 python 开发语言

import schedule
import time
import pyodbc
import pandas as pd
from datetime import datetime, timedelta
from sqlalchemy import create_engine, text
import warnings
import logging

# 配置数据库连接
source_databases = [
    {
        'database_name': '',
        'server': '',
        'database': '',
        'username': '',
        'password': '',
        'branch_id': 0  # 分店ID
    },
]

# 目标数据库配置
target_database = {
    'database_name': '',
    'server': '',
    'database': '',
    'username': '',
    'password': ''
}

# 要处理的表及其唯一标识字段和日期字段
tables = {
    'cmis_patientinfo': {'unique_field': '唯一标识', 'date_field': '日期字段', 'fendian_field': '分店ID'},
    'cmis_yuyue': {'unique_field': '唯一标识', 'date_field': '日期字段', 'fendian_field': '分店ID'},
}


# 连接数据库
def connect_to_db(config):
    connection_string = f"DRIVER={{ODBC Driver 17 for SQL Server}};SERVER={config['server']};DATABASE={config['database']};UID={config['username']};PWD={config['password']}"
    return pyodbc.connect(connection_string)


# 处理数据
def process_data(df, branch_id, fendian_field):
    df[fendian_field] = branch_id  # 动态更新分店ID
    return df


# 获取前一天的数据
def get_yesterday_data(connection, table, date_field):
    # 获取昨天的日期和时间（0点）
    yesterday_start = datetime.now().replace(hour=0, minute=0, second=0, microsecond=0) - timedelta(days=1)
    # 获取昨天的日期和时间（23:59:59）
    yesterday_end = yesterday_start + timedelta(hours=23, minutes=59, seconds=59)

    # 查询前一天的数据以包含 upload 不为 5 或为 NULL 的条件
    query = f"SELECT * FROM {table} WHERE {date_field} BETWEEN ? AND ? AND (upload != 5 OR upload IS NULL)"

    # 忽略pandas发出的特定UserWarning
    warnings.filterwarnings('ignore', category=UserWarning,
                            message="pandas only supports SQLAlchemy connectable")

    return pd.read_sql(query, connection, params=[yesterday_start, yesterday_end])


# 获取目标表的列名
def get_target_columns(connection, table):
    cursor = connection.cursor()
    cursor.execute(f"SELECT COLUMN_NAME FROM INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME = '{table}'")
    columns = [row.COLUMN_NAME for row in cursor.fetchall()]
    cursor.close()
    return columns


# 数据类型转换函数
def convert_data_types(row):
    new_row = []
    for value in row:
        if pd.isnull(value):
            new_row.append(None)
        elif isinstance(value, pd.Timestamp):
            new_row.append(value.to_pydatetime())
        else:
            new_row.append(value)
    return tuple(new_row)


# 插入数据到目标数据库并更新upload字段
def insert_data_to_target(source_connection, target_connection, table, unique_field, df, db_config):
    print(f"{time.ctime()} —— {db_config['database_name']}：表-{table}: 数据插入中...")
    source_cursor = source_connection.cursor()
    target_cursor = target_connection.cursor()

    target_columns = get_target_columns(target_connection, table)
    df_columns = df.columns.tolist()

    # 过滤出目标表存在的列
    common_columns = [col for col in df_columns if col in target_columns]

    success_count = 0
    failure_count = 0
    error = ''

    for index, row in df.iterrows():
        columns = ', '.join(common_columns)
        placeholders = ', '.join(['?' for _ in common_columns])
        values = convert_data_types(row[common_columns])

        insert_query = f"INSERT INTO {table} ({columns}) VALUES ({placeholders})"

        try:
            target_cursor.execute(insert_query, values)
            target_connection.commit()

            unique_value = row[unique_field]
            # 更新源数据库中 upload 字段为 5
            update_source_query = f"UPDATE {table} SET upload = 5 WHERE {unique_field} = ?"
            source_cursor.execute(update_source_query, unique_value)
            source_connection.commit()
            # 更新目标数据库中 upload 字段为 5
            update_target_query = f"UPDATE {table} SET upload = 5 WHERE {unique_field} = ?"
            target_cursor.execute(update_target_query, unique_value)
            target_connection.commit()

            success_count += 1
        except Exception as e:
            failure_count += 1
            error = e
            target_connection.rollback()
            source_connection.rollback()

    source_cursor.close()
    target_cursor.close()

    message = f"{time.ctime()} —— {db_config['database_name']}：表-{table}: 插入成功 {success_count} 条, 插入失败 {failure_count} 条"

    if failure_count > 0:
        message += f", 失败原因: {error}"

    print(message)
    # print(f"{time.ctime()} —— {db_config['database_name']}：表-{table}: 插入成功 {success_count} 条, 插入失败 {failure_count} 条")


# 主任务
def main_task():
    source_conn = None
    target_conn = None
    for db_config in source_databases:
        try:
            # 连接数据库
            source_conn = connect_to_db(db_config)
            print(f"{time.ctime()} —— {db_config['database_name']}-数据库连接成功！")
            target_conn = connect_to_db(target_database)
            print(f"{time.ctime()} —— {target_database['database_name']}-数据库连接成功！")

            for table, fields in tables.items():
                unique_field = fields['unique_field']
                date_field = fields['date_field']
                fendian_field = fields['fendian_field']
                try:
                    df = get_yesterday_data(source_conn, table, date_field)
                    if not df.empty:
                        processed_df = process_data(df, db_config['branch_id'], fendian_field)
                        insert_data_to_target(source_conn, target_conn, table, unique_field, processed_df, db_config)
                        # print(f"{time.ctime()} —— {db_config['database_name']}：表-{table}： 数据处理成功！")
                    else:
                        print(f"{time.ctime()} —— {db_config['database_name']}：表-{table}： 暂无待处理的昨日数据！")
                except Exception as e:
                    print(f"{time.ctime()} —— {db_config['database_name']}：表-{table}：处理数据失败！error: {e}")
        except Exception as e:
            # print(f"{time.ctime()} —— {db_config['database_name']}-数据库连接失败！ error: {e}")
            logging.error(f"{time.ctime()} —— {db_config['database_name']}-数据库连接失败！ error: {e}")
            continue
        finally:
            try:
                if source_conn is not None:
                    source_conn.close()
                    print(f"{time.ctime()} —— 关闭数据库连接 {db_config['database_name']}")
            except Exception as e:
                logging.error(f"{time.ctime()} —— 关闭 {db_config['database_name']}-数据库连接时出错： {e}")

            try:
                if target_conn is not None:
                    target_conn.close()
                    print(f"{time.ctime()} —— 关闭数据库连接 {target_database['database_name']}")
            except Exception as e:
                logging.error(f"{time.ctime()} —— 关闭 {target_database['database_name']}-数据库连接时出错： {e}")

# 定时任务
schedule.every().day.at("03:00").do(main_task)

while True:
    schedule.run_pending()
    time.sleep(40)

原文地址：https://blog.csdn.net/weixin_61769998/article/details/140500930

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：vue3前端开发-执行npm run dev提示报错怎么解决
下一篇：oracle 经营范围设计

C# yolo10使用onnx推理
本篇总结C#端使用yolo10的onnx文件做模型推理，主要使用Microsoft.ML.OnnxRuntime.Gpu这个库。需要注意的是Microsoft.ML.OnnxRuntime 和 Mic
阅读更多2024-11-18
【软件测试】界面、功能、性能、可靠性、安全性（SQL注入、越权）、易用性测试，静态和动态测试
功能测试是为了确保程序以期望的⽅式运⾏⽽按功能要求对软件进⾏的测试，通过对⼀个系统的所有的特性和功能都进⾏测试确保符合需求和规范。软件测试是软件⽣命周期中的⼀个重要环节，具有较⾼的复杂性，对于软件测试
阅读更多2024-11-18
nfs服务器
NFS，网络文件系统）是FreeBSD支持的文件系统中的一种，它允许网络中的计算机（不同的计算机、不同的操作系统）之间通过TCP/IP网络共享资源，主要在unix系列操作系统上使用。在NFS的应用中，
阅读更多2024-11-18
金山云大数据面试题及参考答案
栈（Stack）栈是一种数据结构，它遵循后进先出（LIFO - Last In First Out）的原则。可以把栈想象成一个一端封闭的圆筒，元素只能从开口的一端进出。在计算机内存中，栈主要用于存储函
阅读更多2024-11-18
c++自制游戏（优化）
cout << "******************0、退出************************" << endl;cout <<
阅读更多2024-11-18
C++ -class
类的简介
阅读更多2024-11-18
Cobalt Strike 4.8 用户指南-第九节 Pivoting（跳板）
Pivoting，在本手册中，指的是"将一个受害机器转为其他攻击和工具的跳板"。的Beacon提供了多种pivoting选项。前提是Beacon处于交互模式。交互模式意味着一个Be
阅读更多2024-11-18
达梦 DG
以上步骤和命令提供了达梦DGswitchover的详细操作流程，确保在执行切换操作前，所有的检查和准备工作都已就绪，以保证切换过程的顺利进行。• 检查备库监听配置文件，如tnsnames.ora，并提
阅读更多2024-11-18
Mybatis查询ORACLE数据库相近字段名称的值在映射出来的对象中被覆盖
oracle数据库中有一个表，一个字段的名叫做HEA_MUR，一个字段的名叫HEAMUR，两个字段都是字符串类型。
阅读更多2024-11-18
用Redis实现分布式锁
它的核心思想是通过多个独立的 Redis 实例来增加容错性，确保即使某些实例发生故障或数据不同步，仍然能够提供高可用的分布式锁服务。通常情况下，锁是“非重入”的，也就是说，锁只能被持有它的客户端释放，
阅读更多2024-11-18

python实现把其他sql server数据库的某些表的前一天数据定时存储到自己数据库同名的表中

相关文章