文章归档

共 43 篇文章

2026 (3 篇)

05-06

PaddleOCR 上手实录：Conda 独立环境 + GPU 推理一条龙

从零搭建 PaddleOCR 开发环境的完整记录：Conda 隔离、PaddlePaddle GPU 安装、命令行验证到 Python API 集成。

PaddleOCR OCR Conda 深度学习

04-30

我也用上了 Vibe Coding

从网页对话到 Cline、再到 Cursor，记录我拥抱 AI 编程代理的完整历程，以及它如何切实改变我的开发工作流。

AI Vibe Coding Cursor 效率工具

04-29

我宣布 KDE Plasma 就是世界上最好的桌面环境

从 Fedora 36 一路升级到 43 的踩坑记录，以及对最新版 KDE Plasma 稳定性的惊喜体验。

Linux Fedora KDE 桌面环境

2025 (17 篇)

12-31

VSCode + Qt + CMake 开发环境配置指南

本教程通过视频演示如何快速配置 VSCode、Qt 和 CMake 开发环境，助你高效进行跨平台 C++ 开发。

C++ Qt VSCode CMake

12-30

arXiv 论文速递：视觉语言模型与具身智能最新研究趋势 (2025年5月)

本文深入盘点 2025 年 5 月视觉语言模型（VLM）与具身智能（Embodied AI）领域的最新研究成果，涵盖 3D 场景生成、多智能体协作、机器人控制及安全防御等核心方向。

12-30

arXiv 论文速递：对比学习最新进展、研究趋势与前沿方向

本期速递汇总了近期在对比学习、医学图像分割、图神经网络及生成模型领域的重磅论文，深入解析了从跨模态知识迁移到鲁棒性无监督学习的最新研究趋势。

12-30

arXiv AI 论文精选：2025 年末扩散模型（Diffusion Models）研究前沿与趋势总结

本文盘点了 2025 年末关于扩散模型的关键研究进展，涵盖了视频超分辨率、3D 生成、机器人控制、物理仿真及模型安全等多个领域，展示了该技术向高效、实用及跨学科方向的演进。

12-30

多模态学习前沿综述：从控制生成到自主推理

本文梳理了近期多模态领域的关键研究成果，涵盖了可控生成、自主记忆、鲁棒性提升、多模态推理及安全检测等多个前沿方向，并分析了多模态学习的演进趋势。

12-30

深度解析“上瘾模型”：为什么我们刷手机停不下来？

本文通过尼尔·埃亚尔的“上瘾模型”拆解数字产品背后的行为操控逻辑，并提供实用的反向策略，帮助你夺回注意力的掌控权。

行为设计产品设计数字成瘾

12-30

Git 如何强制拉取远程代码并覆盖本地修改

本文介绍了在测试环境等场景下，如何通过 Git 强制拉取远程最新代码并覆盖本地未提交的修改，同时提供了保留本地改动的安全操作建议。

Git

12-30

遥感领域前沿进展：从多模态推理到灾害感知

本文汇集了近期遥感领域的关键学术进展，涵盖了大规模灾害感知数据集、多模态遥感大模型推理、高光谱图像恢复及无人机自主导航等前沿研究。

12-30

远程光电容积脉搏波（rPPG）研究前沿综述：2025年最新进展

本文盘点了2025年前后在远程光电容积脉搏波（rPPG）领域的数十项关键研究，涵盖多模态融合、轻量化模型、动态场景鲁棒性及临床应用等前沿方向。

12-30

解决 TensorFlow I/O 版本不兼容导致的报错

在 Kaggle 环境中运行 TensorFlow I/O 时遇到 undefined symbol 错误？本文将教你如何通过匹配正确的版本号来快速解决这一兼容性问题。

Kaggle tensorflow-io Python

12-30

视频生成与多模态理解领域前沿进展速递

本期汇总了视频生成、多模态理解及评估基准领域的最新研究，涵盖从指令引导视频编辑、科学实验视频理解到高效视频压缩与物理推理评估等多项前沿成果。

12-30

为什么光速不变？揭秘宇宙的终极速度限制

光速为何是宇宙的恒定常数？本文深入浅出地解释了狭义相对论的核心原理，探讨光速不变如何重塑了我们对时间和空间的认知。

12-30

具身智能前沿动态：从3D场景生成到多智能体协作

本文系统梳理了近期具身智能领域的关键研究成果，涵盖3D场景生成、视觉-语言-动作模型、多智能体协作、空间智能以及具身安全等核心方向。

12-30

强化学习前沿进展：从机器人控制到多智能体协作

本期汇总了近期强化学习领域的重要研究成果，涵盖了机器人具身智能、多智能体协作、离线强化学习、通信网络优化及生成模型结合等多个前沿方向。

12-30

微表情研究的背景与意义：从心理学发现到计算机视觉的跨学科探索

本文深入探讨了微表情的定义、心理学基础及计算机视觉领域的研究现状，分析了其在公共安全、心理健康及人机交互中的应用价值。

12-30

情绪识别领域最新进展与研究趋势综述

本文系统梳理了近期情绪识别领域的顶尖研究成果，涵盖多模态情感推理、语音驱动面部动画、脑电情感识别及情感数据隐私伦理等前沿方向。

12-30

拉普拉斯妖的消亡：量子力学如何粉碎了“全知预测者”的神话？

拉普拉斯妖曾是科学决定论的巅峰象征，但量子力学的崛起彻底打破了这一幻想。本文探讨了海森堡测不准原理、量子随机性与纠缠如何证明“全知预测者”在物理上是不可能的。

2023 (3 篇)

04-11

解决 OpenVINO 代码库 Clone 失败问题：RPC failed; curl 56

在使用 Git 从 Gitee 克隆 OpenVINO 代码库时，如果遇到 `curl 56` 网络错误，可以通过调整 Git 配置缓冲区大小来解决。

OpenVino Docker GPU Docker

04-08

如何配置 Docker 以免 sudo 权限运行

新安装的 Docker 默认需要 sudo 权限才能执行命令，本文介绍了如何通过将用户加入 docker 用户组来简化操作，并解决了常见的权限报错问题。

Docker GPU Docker

03-31

如何为 face_recognition 开启 CUDA GPU 加速支持

face_recognition 默认仅支持 CPU 计算，本文介绍了如何通过重新编译支持 CUDA 的 dlib，实现人脸识别的 GPU 加速。

Docker GPU Docker Web Camera face_recogntion

2022 (11 篇)

11-03

使用 Docker 部署 GPU 与 Web 相机应用程序

本文介绍了如何利用 Docker 容器化技术部署带有 GPU 加速和外接相机功能的 Python 应用程序，并探讨了如何配置私有镜像仓库及清理磁盘空间。

Docker Image Recognition GPU Docker Web Camera

08-11

GNUPlot 编译安装指南

本指南介绍了如何在 CentOS 8 或 AWS Linux 2 环境下通过源码编译安装 GNUPlot 5.4.3，并解决了 libgd 的兼容性问题。

GNUPlot CentOS 8 aws-linux-2

07-04

在 CentOS 8 上编译支持 CUDA 的 FFmpeg

本文介绍了如何在 CentOS 8 系统下编译并安装支持 CUDA 硬件加速的 FFmpeg，涵盖了必要的依赖环境配置及编译步骤。

FFMepeg CUDA CentOS 8

06-15

C++ 正则表达式入门指南

本文介绍了如何在 C++ 中使用 `<regex>` 标准库进行字符串模式匹配与处理，涵盖了基础用法及核心组件。

Regex 正则表达式 C-Cpp

06-15

在 OpenCV 4.5 中使用 CvxText 绘制中文的适配指南

本文介绍了如何通过简单修改 CvxText 代码，使其在 OpenCV 4.5 环境下正常运行，解决头文件引用及数据类型转换等兼容性问题。

CvxText OpenCV 4.5 C-Cpp

06-15

使用 POCO 库进行 FTP 操作

本文介绍了如何使用轻量级 C++ 网络库 POCO 实现简单的 FTP 文件上传功能。

FTP poco C-Cpp

04-14

使用 PaddleOCR 实现曲线文本检测

文本检测是计算机视觉中的经典任务，而曲线文本由于其自由多变的形态更具挑战性。本文将引导您如何使用 PaddleOCR 运行曲线文本检测。

Deep Learning Inference OCR Curved Text Detection PaddleOCR

03-26

NumPy 到 OpenCV Mat 的转换技巧

本文介绍了如何将常见的 NumPy 数组操作（如 Sigmoid 函数、通道切片及条件过滤）迁移到 C++ OpenCV 的 `cv::Mat` 实现中。

Numpy to C++ cv::Mat

03-09

使用 PySide6 在 Python 中实现 OpenCV 视频流显示的最简指南

本文介绍如何使用官方 PySide6 库结合 OpenCV，将摄像头视频流实时显示在 Qt 界面中，提供简洁易懂的实现方案。

Python Qt OpenCV Image Processing

03-04

MMOCR 安装指南及自定义数据集训练

本指南详细介绍了如何安装 MMOCR 框架，并演示了如何将 PASCAL VOC 格式的自定义数据集转换为 COCO 格式以进行模型训练。

MMOCR OCR Pytorch

02-08

在 Ubuntu 16.04 局域网环境下搭建 GitLab 服务

本文介绍了如何在没有域名的情况下，在 Ubuntu 16.04 局域网服务器中快速搭建并配置 GitLab，旨在避开复杂冗长的官方文档流程。

GitLab Git Ubuntu 16.04

2021 (8 篇)

08-26

利用 OpenCV 中的 & 运算符优雅地处理 ROI 边界裁剪

本文介绍了如何使用 OpenCV 的 `&` 运算符对 `cv::Rect` 进行求交集操作，从而优雅地实现图像 ROI 裁剪与边界检查，避免繁琐的条件判断。

C-Cpp Operator & OpenCV Image Processing

08-24

MNIST-ROT 数据集使用指南

本文简要介绍了 MNIST-ROT（旋转 MNIST）数据集，它是验证旋转等变算法最常用的基准数据集之一，并提供了下载链接。

PyTorch MNIST-ROT Deep Learning Neural Network Training

08-24

PyTorch 学习率调整器 (LR Scheduler) 详解

介绍 PyTorch 中常用的学习率调整策略及其在训练流程中的应用，通过 StepLR 示例展示如何有效管理模型训练的学习率。

Python PyTorch lr_scheduler Deep Learning

08-23

OpenCV DNN 批量推理：图像分类实战指南

本文介绍了如何使用 OpenCV DNN 模块进行图像分类，重点讲解了单图与批量推理的流程、核心 API 的使用以及 HWC 与 NCHW 格式的区别。

C-Cpp OpenCV Image Classification Batch Inference

08-21

Qt HTTP 服务器示例：客户端 POST 请求与服务端实现

本文介绍如何使用 Qt 实现 HTTP POST 客户端请求，并配合 QtHttpServer 模块快速搭建一个能够接收并处理 JSON 数据的本地服务器。

C-Cpp Qt QtHttpServer CMake

08-20

使用 CMake 管理 C/C++ 项目：从基础到第三方库集成

本文介绍了如何使用 CMake 高效管理 C/C++ 项目，并详细说明了如何集成 OpenCV、Boost、Qt 和 CUDA 等主流第三方库。

C-Cpp CMake Qt OpenCV

08-18

编译 QtHttpServer 并封装为 C 接口动态库：解决 QCoreApplication 依赖问题

本文介绍如何编译 QtHttpServer 模块，并探讨在非 Qt 环境下调用 Qt 动态库时，如何正确处理 QCoreApplication 初始化与事件循环。

C-Cpp Qt QtHttpServer CMake

08-16

Windows 10 环境下使用 CMake 和 VS2019 编译带 CUDA 支持的 OpenCV

本文详细介绍了在 Windows 10 环境下，如何使用 CMake 和 Visual Studio 2019 从源码编译带 CUDA 加速支持的 OpenCV 库，并集成 opencv_contrib 模块。

C-Cpp CMake Win10 OpenCV

2012 (1 篇)

05-10

在 Visual Studio 2010 中配置 FFTW 3.3.2 快速傅里叶变换库

本文详细介绍了如何在 VS2010 开发环境下安装和配置 FFTW 3.3.2 库，包括生成 .lib 文件、解决 lib 命令失效问题以及项目属性设置，并附带完整的测试代码。

FFTW 3.3.2 VS2010 Visual Studio 2010 C-Cpp