Name		Name	Last commit message	Last commit date
parent directory ..
readme.md		readme.md

readme.md

List for public implementation of various algorithms

1) Pubilc Datasets and Challenges

2) Pioneers and Experts

3) Blogs and Videos

4) Papers and Sources Codes

▶ Datasets Papers

KTH(ICPR2004) Recognizing human actions: a local SVM approach [paper link]
Weizmann(ICCV2005) Actions as space-time shapes [paper link]
UCF101(arxiv2012) UCF101: A Dataset of 101 Human Actions Classes From Videos in The Wild [arxiv link]
Kinetics(arxiv2017) The Kinetics Human Action Video Dataset [arxiv link]
EPIC-Kitchens(ECCV2018) Scaling Egocentric Vision: The EPIC-KITCHENS Dataset [project link]
HACS(arxiv2019) HACS: Human Action Clips and Segments Dataset for Recognition and Temporal Localization [arxiv link]
Moments-in-Time(TPAMI2019) Moments in Time Dataset: one million videos for event understanding [project link]
FineGym(CVPR2020) FineGym: A Hierarchical Video Dataset for Fine-grained Action Understanding [project link]

▶ Technique Papers

1) 基于人工特征(Manual-Features)

梯度直方图HOG(CVPR2005) Histograms of Oriented Gradients for Human Detection [paper link]
时空兴趣点检测(IJCV2005) On Space-Time Interest Points [paper link]
光流直方图(CVPR2008) Learning Realistic Human Actions from Movies [paper link]
密集轨迹特征DT(CVPR2011) Action Recognition by Dense Trajectories [paper link][project link][Codes|offical C++]
密集轨迹特征iDT(ICCV2013) Action Recognition with Improved Trajectories [paper link][CSDN blog1][CSDN blog2]
RepresentationFlows(CVPR2019) Representation Flow for Action Recognition [arxiv link][project link][Codes|PyTorch(offical)]

2) 基于时空双流神经网络(Two-Stream)

Two-Stream(NIPS2014) Two-Stream Convolutional Networks for Action Recognition in Videos [arxiv link]
two-stream+LSTM(CVPR2015) Long-term Recurrent Convolutional Networks for Visual Recognition and Description [arxiv link][project link][Codes|offical]
two-stream+LSTM(CVPR2015) Beyond short snippets: Deep networks for video classification [paper link]
two-stream fusion(CVPR2016) Convolutional Two-Stream Network Fusion for Video Action Recognition [arxiv link][Codes|offical Matlab MatConvNet]
TSN(ECCV2016) Temporal Segment Networks: Towards Good Practices for Deep Action Recognition [arxiv link][project link][Codes|PyTorch(offical)]
Co-occurrence+LSTM(+pose)(AAAI2016) Co-occurrence Feature Learning for Skeleton based Action Recognition using Regularized Deep LSTM Networks [arxiv link]
RNN-based(+pose)(ECCV2016) Online Human Action Detection using Joint Classification-Regression Recurrent Neural Networks [arxiv link]
TSN-based improved 1(CVPR2017) Deep Local Video Feature for Action Recognition [arxiv link]
ST+Attention+LSTM(+pose)(AAAI2017) An End-to-End Spatio-Temporal Attention Model for Human Action Recognition from Skeleton Data [arxiv link]
TRN(TSN-based improved 2)(ECCV2018) Temporal Relational Reasoning in Videos [arxiv link]
ST-GCN(+openpose)(AAAI2018) Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition [arxiv link]
密集扩张网络(TIP2019) Dense Dilated Network for Video Action Recognition [paper link]

3) 基于三维卷积的神经网络(3D-ConvNet)

C3D(ICCV2015) Learning Spatiotemporal Features with 3D Convolutional Networks [arxiv link][paper link][project link][Codes|offical caffe]
3D-ResNets(CVPR2018) Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet? [arxiv link][paper link][Codes|PyTorch(offical)]
I3D(Facebook, use inception-V1)(CVPR2017) Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset [arxiv link][Codes|Tensorflow(offical)][Codes|PyTorch(unoffical v1)][Codes|PyTorch(unoffical v2)]
T3D(CVPR2017) Temporal 3D ConvNets: New Architecture and Transfer Learning for Video Classification [arxiv link][Codes|offical PyTorch]
P3D(MSRA)(ICCV2017) Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks [arxiv link][CSDN blog]
TPC(based on CDC)(AAAI2018) Exploring Temporal Preservation Networks for Precise Temporal Action Localization [arxiv link]
3D-ResNets(arxiv2020) Would Mega-scale Datasets Further Enhance Spatiotemporal 3D CNNs? [arxiv link][Codes|PyTorch(offical)]

4) 基于长短记忆网络(LSTM)

two-stream+LSTM(CVPR2015) Long-term Recurrent Convolutional Networks for Visual Recognition and Description [arxiv link][project link][Codes|offical]

5) 基于对抗神经网络(GAN)

GAN-based(IJCAI2018) Exploiting Images for Video Recognition with Hierarchical Generative Adversarial Networks [arxiv link]

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

action_recognition

action_recognition

readme.md

List for public implementation of various algorithms

1) Pubilc Datasets and Challenges

2) Pioneers and Experts

3) Blogs and Videos

4) Papers and Sources Codes

▶ Datasets Papers

▶ Technique Papers

1) 基于人工特征(Manual-Features)

2) 基于时空双流神经网络(Two-Stream)

3) 基于三维卷积的神经网络(3D-ConvNet)

4) 基于长短记忆网络(LSTM)

5) 基于对抗神经网络(GAN)

Files

action_recognition

Directory actions

More options

Directory actions

More options

Latest commit

History

action_recognition

Folders and files

parent directory

readme.md

List for public implementation of various algorithms

1) Pubilc Datasets and Challenges

2) Pioneers and Experts

3) Blogs and Videos

4) Papers and Sources Codes

▶ Datasets Papers

▶ Technique Papers

1) 基于人工特征(Manual-Features)

2) 基于时空双流神经网络(Two-Stream)

3) 基于三维卷积的神经网络(3D-ConvNet)

4) 基于长短记忆网络(LSTM)

5) 基于对抗神经网络(GAN)