PaddleOCR 上手实录:Conda 独立环境 + GPU 推理一条龙
从零搭建 PaddleOCR 开发环境的完整记录:Conda 隔离、PaddlePaddle GPU 安装、命令行验证到 Python API 集成。
共 43 篇文章
从零搭建 PaddleOCR 开发环境的完整记录:Conda 隔离、PaddlePaddle GPU 安装、命令行验证到 Python API 集成。
从网页对话到 Cline、再到 Cursor,记录我拥抱 AI 编程代理的完整历程,以及它如何切实改变我的开发工作流。
从 Fedora 36 一路升级到 43 的踩坑记录,以及对最新版 KDE Plasma 稳定性的惊喜体验。
本教程通过视频演示如何快速配置 VSCode、Qt 和 CMake 开发环境,助你高效进行跨平台 C++ 开发。
本文深入盘点 2025 年 5 月视觉语言模型(VLM)与具身智能(Embodied AI)领域的最新研究成果,涵盖 3D 场景生成、多智能体协作、机器人控制及安全防御等核心方向。
本期速递汇总了近期在对比学习、医学图像分割、图神经网络及生成模型领域的重磅论文,深入解析了从跨模态知识迁移到鲁棒性无监督学习的最新研究趋势。
本文盘点了 2025 年末关于扩散模型的关键研究进展,涵盖了视频超分辨率、3D 生成、机器人控制、物理仿真及模型安全等多个领域,展示了该技术向高效、实用及跨学科方向的演进。
本文梳理了近期多模态领域的关键研究成果,涵盖了可控生成、自主记忆、鲁棒性提升、多模态推理及安全检测等多个前沿方向,并分析了多模态学习的演进趋势。
本文汇集了近期遥感领域的关键学术进展,涵盖了大规模灾害感知数据集、多模态遥感大模型推理、高光谱图像恢复及无人机自主导航等前沿研究。
本文盘点了2025年前后在远程光电容积脉搏波(rPPG)领域的数十项关键研究,涵盖多模态融合、轻量化模型、动态场景鲁棒性及临床应用等前沿方向。
在 Kaggle 环境中运行 TensorFlow I/O 时遇到 undefined symbol 错误?本文将教你如何通过匹配正确的版本号来快速解决这一兼容性问题。
本期汇总了视频生成、多模态理解及评估基准领域的最新研究,涵盖从指令引导视频编辑、科学实验视频理解到高效视频压缩与物理推理评估等多项前沿成果。
光速为何是宇宙的恒定常数?本文深入浅出地解释了狭义相对论的核心原理,探讨光速不变如何重塑了我们对时间和空间的认知。
本文系统梳理了近期具身智能领域的关键研究成果,涵盖3D场景生成、视觉-语言-动作模型、多智能体协作、空间智能以及具身安全等核心方向。
本期汇总了近期强化学习领域的重要研究成果,涵盖了机器人具身智能、多智能体协作、离线强化学习、通信网络优化及生成模型结合等多个前沿方向。
本文深入探讨了微表情的定义、心理学基础及计算机视觉领域的研究现状,分析了其在公共安全、心理健康及人机交互中的应用价值。
本文系统梳理了近期情绪识别领域的顶尖研究成果,涵盖多模态情感推理、语音驱动面部动画、脑电情感识别及情感数据隐私伦理等前沿方向。
拉普拉斯妖曾是科学决定论的巅峰象征,但量子力学的崛起彻底打破了这一幻想。本文探讨了海森堡测不准原理、量子随机性与纠缠如何证明“全知预测者”在物理上是不可能的。
在使用 Git 从 Gitee 克隆 OpenVINO 代码库时,如果遇到 `curl 56` 网络错误,可以通过调整 Git 配置缓冲区大小来解决。
新安装的 Docker 默认需要 sudo 权限才能执行命令,本文介绍了如何通过将用户加入 docker 用户组来简化操作,并解决了常见的权限报错问题。
face_recognition 默认仅支持 CPU 计算,本文介绍了如何通过重新编译支持 CUDA 的 dlib,实现人脸识别的 GPU 加速。
本文介绍了如何利用 Docker 容器化技术部署带有 GPU 加速和外接相机功能的 Python 应用程序,并探讨了如何配置私有镜像仓库及清理磁盘空间。
本指南介绍了如何在 CentOS 8 或 AWS Linux 2 环境下通过源码编译安装 GNUPlot 5.4.3,并解决了 libgd 的兼容性问题。
本文介绍了如何在 CentOS 8 系统下编译并安装支持 CUDA 硬件加速的 FFmpeg,涵盖了必要的依赖环境配置及编译步骤。
本文介绍了如何通过简单修改 CvxText 代码,使其在 OpenCV 4.5 环境下正常运行,解决头文件引用及数据类型转换等兼容性问题。
文本检测是计算机视觉中的经典任务,而曲线文本由于其自由多变的形态更具挑战性。本文将引导您如何使用 PaddleOCR 运行曲线文本检测。
本文介绍了如何将常见的 NumPy 数组操作(如 Sigmoid 函数、通道切片及条件过滤)迁移到 C++ OpenCV 的 `cv::Mat` 实现中。
本文介绍如何使用官方 PySide6 库结合 OpenCV,将摄像头视频流实时显示在 Qt 界面中,提供简洁易懂的实现方案。
本指南详细介绍了如何安装 MMOCR 框架,并演示了如何将 PASCAL VOC 格式的自定义数据集转换为 COCO 格式以进行模型训练。
本文介绍了如何在没有域名的情况下,在 Ubuntu 16.04 局域网服务器中快速搭建并配置 GitLab,旨在避开复杂冗长的官方文档流程。
本文介绍了如何使用 OpenCV 的 `&` 运算符对 `cv::Rect` 进行求交集操作,从而优雅地实现图像 ROI 裁剪与边界检查,避免繁琐的条件判断。
本文简要介绍了 MNIST-ROT(旋转 MNIST)数据集,它是验证旋转等变算法最常用的基准数据集之一,并提供了下载链接。
介绍 PyTorch 中常用的学习率调整策略及其在训练流程中的应用,通过 StepLR 示例展示如何有效管理模型训练的学习率。
本文介绍了如何使用 OpenCV DNN 模块进行图像分类,重点讲解了单图与批量推理的流程、核心 API 的使用以及 HWC 与 NCHW 格式的区别。
本文介绍如何使用 Qt 实现 HTTP POST 客户端请求,并配合 QtHttpServer 模块快速搭建一个能够接收并处理 JSON 数据的本地服务器。
本文介绍了如何使用 CMake 高效管理 C/C++ 项目,并详细说明了如何集成 OpenCV、Boost、Qt 和 CUDA 等主流第三方库。
本文介绍如何编译 QtHttpServer 模块,并探讨在非 Qt 环境下调用 Qt 动态库时,如何正确处理 QCoreApplication 初始化与事件循环。
本文详细介绍了在 Windows 10 环境下,如何使用 CMake 和 Visual Studio 2019 从源码编译带 CUDA 加速支持的 OpenCV 库,并集成 opencv_contrib 模块。
本文详细介绍了如何在 VS2010 开发环境下安装和配置 FFTW 3.3.2 库,包括生成 .lib 文件、解决 lib 命令失效问题以及项目属性设置,并附带完整的测试代码。