C# 배열을 Numpy ndarray 배열과 상호 변환
Python.NET과 C#을 연동해 tensorflow를 사용하는 경우 Numpy ndarray 배열로의 변환이 자주 발생하게 됩니다.
예를 들기 위해, MNIST의 테스트 이미지 데이터를 1개 반환하는 파이썬 코드를 아래와 같이 만들면,
# ndarray_test.py
import setuptools.dist
from tensorflow.keras.datasets import mnist
(_, _), (test_images, _) = mnist.load_data()
test_images = test_images.reshape((10000, 28 * 28)) # 이미지를 28 * 28 크기로 변경
test_images = test_images.astype('float32') / 255
def get_test_image():
return test_images[0]
C#에서 get_test_image 함수를 호출해 이미지 데이터를 가져올 수 있습니다.
PyObject test_image = pyFile.InvokeMethod("get_test_image");
// ndarray를 C# 배열로 가져오는 코드
// Span<float> arr = ToSpan<float>(test_image);
PyObject 형식으로 가져왔으니 이제 C# 배열 형식으로 바꿔야 할 텐데요, 당연히 최대한 성능 손실을 없애기 위해서는 복사가 아닌 포인터 그대로 활용하는 것이 좋습니다. 그럼, 이럴 때 Span을 활용하는 것이 좋겠죠? ^^
static unsafe Span<T> ToSpan<T>(PyObject test_image)
{
PyBuffer buffer = test_image.GetBuffer();
nint ptr = buffer.Buffer;
int bufferSize = (int)(buffer.Length / buffer.ItemSize);
return new Span<T>(ptr.ToPointer(), bufferSize);
}
이를 활용해 Numpy 배열을 Span으로 바꿀 수 있고, 만약 배열이 필요하다면 (아쉽게도 메모리 복사가 발생하지만) Span으로부터 언제든 ToArray()를 호출해 C# 배열로 자유롭게 활용할 수 있습니다.
PyObject test_image = pyFile.InvokeMethod("get_test_image");
Span<float> arr = ToSpan<float>(test_image);
foreach (var value in arr)
{
Console.Write($"{value},"); // 784(28 x 28)개의 요소 나열
}
float[] floatArrays = arr.ToArray(); // 필요하다면 배열로 변환
반대로, C# 배열을 numpy 배열로 만드는 것은 Python의 Numpy 모듈을 이용해 다음과 같이 변환할 수 있습니다.
float[] floatArrays = ...;
dynamic npModule = Py.Import("numpy");
dynamic npArray = npModule.array(floatArrays);
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]