黄汉卿


  • Home

  • About

  • Archives

  • Search

显著性目标检测调研

Posted on 2021-06-14
一,背景显著性目标检测是模拟人的视觉系统,针对一幅图片检测出人眼关注的区域,简单描述就是一个二分类的语义分割模型。有很多应用比如图像传输与压缩(优先保证显著区域),判定为显著区域等等。 二,方法在深度学习占有绝对优势之前,显著区域检测已经有了很多方法,传统显著性目标检测主要利用直观感觉或者启发式经验,如利用色度比较,背景比较,边界点检测等人工提取特征的方法,但是这类方法需要复杂的经验,以及比较耗时。 2.1 基于边缘/语义增强的显著目标检测深度网络的低层特征能更好的表征物体结构,边缘,高层特征能更好的表征语义信息,因此很多研究通过对低层特征操作来增强显著 ...
Read more »

SIMCLR自监督算法论文读书笔记

Posted on 2021-06-14
原文:https://link.zhihu.com/?target=https%3A//amitness.com/2020/03/illustrated-simclr/ GitHub:https://link.zhihu.com/?target=https%3A//github.com/google-research/simclr 引言过去的自监督算法存在诸多问题,本文截止2020.02是SOTA,具有思想简单,效果好的优点 实现方法方法的整体框架图 整体的思路是对图像做数据增强,让图像对通过两个分支,通过对比损失,拉开同源图片,推开不同源的图片,具体 ...
Read more »

图片自动裁剪调研

Posted on 2021-06-14
一,引言图片自动裁剪用于从一张图片中裁剪出最合适的子图,子图具有更合理的布局,更美观的效果等。图片自动裁剪在飞猪潜在的应用场景包括自动裁剪从外源爬取过来的图片等。与自动裁剪相关的任务名称还包括图片智能裁剪,image retarget 二,方法2.1 暴力搜索的方法暴力搜索法[3]是比较早的研究思路,它通过滑动窗口的方式获取一系列的候选裁剪框,然后从中选择美学分数最高的,滑动窗口,暴力搜索所有的子图,耗时大。 2.2 基于显著图预处理基于显著图的自动构图方法是最早期用于自动构图的方法,被称为 Attention-Based的方法。它基于一个假设,图像中最 ...
Read more »

回归问题数据不平衡

Posted on 2021-06-14
一,背景机器学习中数据不平衡是一种常见问题,数据集不平衡分为分类(离散)数据的失衡和回归(连续)数据的失衡,目前绝大部分的解决方案都是针对分类失衡而提出的,回归问题的失衡指的是连续数据比例分布不均匀,如在图片美学数据集的场景下,AADB的数据统计分布为正太分布,两端得分分布较少,用不均衡的数据拟合训练得到的模型,会导致很多意想不到的问题。 二,方法数据不平衡问题的解决方法基本上可以分为基于数据层面的解决方案,基于算法层面的解决方案,以及一些其他比较小众的方案。 2.1 分类问题的数据不平衡2.1.1 基于数据的解决方案 下采样,对样本数量比较多的类别数据 ...
Read more »

nms及其各种变体

Posted on 2021-06-14
summary 普通nms, ICCV, 2017 加权平均nms, (Weighted NMS), ICME Workshop, 2017 定位优先nms, ECCV, 2018 自适应阈值,CVPR, 2019 中心点距离,DIoU, AAAI, 2020 一,普通nms传统nms的逻辑是先对预测框分类别,针对具体某一个类别的框,先按照该框内是否有物体的置信度分排序,然后取得分最高的和他之后的框做iou,将iou大于阈值的框剔除。依次重复这个过程,直到所有框都被处理完毕,代码见nms.py,该方法的优点是简单容易理解且容易实现,缺点是效率低,刚性阈 ...
Read more »

美学综述

Posted on 2021-06-14
1 引言图片美学(Image Aesthetic Assessment)评价是一个重要的课题,评价图片的质量美学在很多方面有广泛的应用,如在视频网站视频封面筛选,图片检索网站图片排序,视频失真等等。图片美学的主要目标是要从感官上区分好看与不好看,转化为计算机可表达的量则为美学分,美学级别分类等等。 图片美学的研究任务可以分为美学图片分类,美学评分,美学分布,美学因素,美学描述;美学分类是对图片质量高低做分类,如质量高,质量中,质量低;美学评分为给图片打分,美感分布则给图片一个美学分的分布;美学因素是评价图片某个具体因素的得分,如图片色彩的评分;美感描述为 ...
Read more »

conda&virtual对比

Posted on 2020-11-28
conda相关 创建环境 create -n pytorch3 python1234 - 删除环境 conda删除环境 ````conda remove -n name --all` 配置国内源,conda源 123conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs ...
Read more »

行车记录仪

Posted on 2020-11-01
摄像头树莓派外接摄像头有两种一般法,一种是通过USB,这种比较常用,另一种是通过CIS,这种事树莓派官方自带的方法,我就是通过这种接口外接摄像头获取图片的 注意方向别插反了,摄像头排线金属的朝金属的一方,插好硬件后 raspi-config```12选5```interfacing options 接着选1 Camera选择enable,系统会提示重启,重启后就可以了 获取图片这部分采用最简单的raspistill工具获取 获取的shell命令为-o image.jpg -t 1000```12程序设置每秒取一张图片,代码如下 import osimpo ...
Read more »

摄像头监控存储

Posted on 2020-10-24
背景很多人都会买家用监控摄像头,比如小米摄像头。一般费用由两方面,一个是买摄像头的硬件成本,比如小米的也就100-200左右;另一方面是存储的服务费,如果你想看7天前的录像,或者看一个月前的录像,这个云服务是收费的,我刚好有一台台式机,我就把摄像头的视频取出来存储在本地 环境摄像头:水星 操作系统:ubuntu18.04 过程参考水星官方获取流地址的指导教程:https://security.tp-link.com.cn/service/detail_article_4432.html 代码 123456789101112131415161718192 ...
Read more »

caffe-classify

Posted on 2020-08-22
环境caffe, Ubuntu16.04, python2.7 编译caffe这里需要注意一点,读取数据用python读取图片,不用官方推荐的lmdb数据格式,这样更容易定位问题 定义类名为1classifyInput 的python类文件:1classify-input.py 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747 ...
Read more »
12…7

63 posts
GitHub
© 2021
Powered by Hexo
|
Theme — NexT.Muse v5.1.4