#

CUDA

CUDA® is a parallel computing platform and programming model developed by NVIDIA for general computing on graphical processing units (GPUs). With CUDA, developers are able to dramatically speed up computing applications by harnessing the power of GPUs.

Here are 5,336 public repositories matching this topic...

vllm-project / vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

amd cuda inference pytorch transformer llama gpt rocm model-serving tpu hpu mlops xpu llm inferentia llmops llm-serving trainium

Updated Nov 26, 2024
Python

rapidsai / cudf

cuDF - GPU DataFrame Library

python data-science cpp gpu arrow pydata cuda pandas data-analysis dask dataframe rapids cudf

Updated Nov 26, 2024
C++

iree-org / iree

A retargetable MLIR-based machine learning compiler and runtime toolkit.

machine-learning compiler runtime tensorflow vulkan cuda pytorch spirv jax mlir

Updated Nov 26, 2024
C++

OpenVoiceOS / status

Open Voice OS Server Status Page

status text-to-speech translator monitoring alerting cuda sam nvidia tts uptime stats speech-to-text stt piper ovos upptime openvoiceos fasterwhisper mimic3

Updated Nov 26, 2024
Markdown

sgl-project / sglang

SGLang is a fast serving framework for large language models and vision language models.

cuda inference pytorch transformer moe llama vlm llm llm-serving llava llama2 llama3 llama3-1

Updated Nov 26, 2024
Python

open-atmos / PySDM

Pythonic particle-based (super-droplet) warm-rain/aqueous-chemistry cloud microphysics package with box, parcel & 1D/2D prescribed-flow examples in Python, Julia and Matlab

python research simulation gpu cuda atmospheric-modelling monte-carlo-simulation gpu-computing physics-simulation numba thrust pint particle-system pypi-package nvrtc atmospheric-physics

Updated Nov 26, 2024
Python

pytorch / ao

PyTorch native quantization and sparsity for training and inference

training sparsity cuda inference optimizer pytorch transformer offloading llama quantization mx brrr dtypes float8

Updated Nov 26, 2024
Python

pytorch / torchrec

Pytorch domain library for recommendation systems

deep-learning gpu cuda pytorch recommendation-system sharding recommender-system

Updated Nov 25, 2024
Python

catboost / catboost

A fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports computation on CPU and GPU.

python data-science machine-learning data-mining tutorial r big-data gpu cuda kaggle gbdt gbm gpu-computing decision-trees gradient-boosting coreml catboost categorical-features

Updated Nov 25, 2024
Python

beam-cloud / beta9

Run serverless GPU workloads with fast cold starts on bare-metal servers, anywhere in the world

lambda serverless gpu distributed-computing cuda self-hosted paas faas functions-as-a-service autoscaler fine-tuning developer-productivity cloudrun serverless-containers ml-platform large-language-models llm generative-ai llm-inference

Updated Nov 25, 2024
Go

rapidsai / nx-cugraph

GPU Accelerated Backend for NetworkX

graph cuda networkx rapids

Updated Nov 25, 2024
Python

fangq / mcx

Monte Carlo eXtreme (MCX) - GPU-accelerated photon transport simulator

c pascal monte-carlo matlab cuda physics-simulation ray-tracing 3d voxel-based optical-imaging photon-transport volumetric-rendering

Updated Nov 25, 2024
Pascal

rapidsai / cugraph

cuGraph - RAPIDS Graph Analytics Library

graph graph-algorithms gpu cuda nvidia complex-networks graph-analysis graphml graph-framework rapids

Updated Nov 26, 2024
Cuda

rapidsai / cuml

cuML - RAPIDS Machine Learning Library

machine-learning gpu machine-learning-algorithms cuda nvidia

Updated Nov 26, 2024
C++

mateeeeeee / Amber

OptiX path tracer

path-tracer cuda ray-tracing optix path-tracing

Updated Nov 25, 2024
C++

jdermody / brightwire

Bright Wire is an open source machine learning library for .NET with GPU support (via CUDA)

machine-learning csharp neural-network gpu cuda recurrent-neural-networks machine-learning-library machinelearning convolutional-neural-networks cuda-support gpu-support

Updated Nov 25, 2024
C#

roflmaostc / RadonKA.jl

A simple yet sufficiently fast (attenuated) Radon and backproject implementation using KernelAbstractions.jl. Runs on CPU, CUDA, ...

gpu optimization julia automatic-differentiation cuda julia-language tomography radon ct x-ray computed-tomography radon-transform

Updated Nov 26, 2024
Julia

NVIDIA / cccl

CUDA Core Compute Libraries

cpp hpc gpu modern-cpp parallel-computing cuda nvidia gpu-acceleration cuda-kernels gpu-computing parallel-algorithm parallel-programming nvidia-gpu gpu-programming cuda-library cpp-programming cuda-programming accelerated-computing cuda-cpp

Updated Nov 25, 2024
C++

Gui-Yom / turbo-metrics

Hardware acceleration for your daily video tasks

video cuda npp amf nvdec ssimulacra2

Updated Nov 25, 2024
Rust

markus-perl / ffmpeg-build-script

The FFmpeg build script provides an easy way to build a static FFmpeg on OSX and Linux with non-free codecs included.

Updated Nov 25, 2024
Shell

Created by Nvidia

Released June 23, 2007

Followers: 225 followers
Website: developer.nvidia.com/cuda-zone
Wikipedia: Wikipedia

Related Topics

nvcc